2 4
3 34-
14 .
6 .8
09
a
Data i l v Wrangling
s S
n to
S a
Do
o s e
o J
i eg
D
2 4
3 34-
14 .
6 .8
a 09
l v
Si
s Dados no R
Preparação ode
n t
Sa
D o
s e
o Jo
i eg
D
2
Data wrangling
2 4
• Utilizaremos, principalmente, o dplyr 3 34-
14 .
6 .8
• O dplyr é um pacote contido no tidyverse
a 09
l v
Si
tos
• Contém funções úteis para a manipulação/preparação
n de bancos de dados
S a
D o
• Material para referência:
o s e
o J
i eg
• [Link]
D
• [Link]
• Wickham, H. & Grolemund, G. R for Data Science: [Link]
3
Data wrangling
2 4
3 34-
14 .
• Pipe: encadeamento de diversas funções em sequência
6 .8
• Rename: alteração de nomes de variáveis 09
• Mutate: alteração de conteúdo das variáveisi l va e criação de novas variáveis
s S
• Filter: seleção de observações com
n tobase em critérios lógicos
• Select: seleção de variáveis Sa
•
o
D com medidas resumo (estatísticas descritivas)
Summarise: criação de
o s e tabelas
• J
Group by: agrupamento das observações com base em critérios
• go de bancos de dados
Join: junçãoie(merge)
D
4
2 4
3 34-
14 .
6 .8
a 09
l v
Si
Criação de Projects oesScripts R Markdown
n t
Sa
D o
s e
o Jo
i eg
D
5
R Markdown
2 4
3 34-
14 .
• Introdução ao R Markdown
6 .8
• Formatação básica do texto
a 09
l v
• Inserção de fórmulas
s Si
• Chunks
n to
• Gerando outputs (HTML; PDF,S aDOC)
D o
o s e
J
• Material para referência:
o
i eg
D
• [Link]
6
2 4
3 34-
14 .
6 .8
a 09
l v
Si
os & Analytics no GitHub
Projetos de Data Science
n t
Sa
D o
s e
o Jo
i eg
D
7
Git
2 4
• Software útil para o controle de versões 3 34-
14 .
6 .8
09
lva
• Registra as alterações feitas nos arquivos
S i
to s
n
acom o Github
S
• Vamos utilizá-lo em conjunto
o
e D
Jo s
o
eg computador ([Link]
• Instalar o Gitino
D
• Basta avançar todas as etapas nas configurações sugeridas
8
Github
2 4
• Site utilizado para hospedar os arquivos 3 34-
14 .
6 .8
• [Link]
a 09
l v
Si s
• Organizado em repositórios (pastas) n to que podem ser compartilhadas,
S a
inclusive, podem ser publicadas
D o
o s e
o
• Útil para armazenarJ
i eg e compartilhar seu portfólio de projetos
D
• Os arquivos do computador podem ser enviados ao Github (pelo Git)
9
Git e Github
2 4
• Add e Commit 3 3 4-
14 .
6 .8
• Crie uma pasta na área de trabalho de seu computador0 9
• No RStudio, crie um novo scrip e escreva l va
i apenas # Versão 1
S
s Versão Exemplo.R
• Salve este arquivo na pasta com oto nome
• Dentro da pasta, clique com S a n
o botão direito do mouse e escolha Git Bash Here
D o
o s e
• No Git, escreva gitJ init (inicializa o Git na pasta selecionada)
eg o
• Escreva git iadd “Versão Exemplo.R” (adiciona o arquivo para o índice)
D
• Para gerar versões utilize o comando git commit -m “título” (são as versões)
O nome do commit, exemplo: “Primeira Versão”
10
Git e Github
2 4
• Push 3 34-
14 .
6 .8
• Em seu Github, crie um novo repositório e nomeie 0 9 como preferir
• Copie o link do repositório criado i l va
S
s ..........(link de sua pasta)..........
• No Git, escreva git remote add origin
n to
• Por fim, digite git push –u origin a
S master (envia o arquivo para o repositório,
D o
o s e
ficando na ramificação principal)
o J
• Na primeiragvez
Di e que for feito, solicitará login no Github
• Após atualizar, é possível verificar que o arquivo já está em seu Github!
11
Git e Github
2 4
• Criando e comparando versões 3 34-
14 .
6 .8
• Abra o arquivo Versão Exemplo e escreva mais09 uma linha: # Versão 2
• Após salvar, feche e com o botão direito l va
iabra o Git Bash Here na pasta
S
• Utilize os mesmos procedimentos:tos
a n
o S
e D
• git add “Versão Exemplo.R”
Jo s
• git commit -m “Segunda
Note que não foi
e o
g master
Versão” necessário informar
• git push –uiorigin novamente o endereço
D
• No Github, a nova versão já está disponível e podemos compará-las!
12
Git e Github
2 4
• Criando ramificações no repositório 3 34-
14 .
6 .8
• Nos comandos anteriores, alteramos a ramificação0 9 principal do repositório
• Poderíamos criar ramificações novas no l va
iGithub
s S
n to
• git checkout -b “nome da nova a
S branch”
o
Dde mudança da “master” para a “nova”
o s e
• No Git, já há a indicação
o J
g
• Os mesmosieprocedimentos de add e commit
D
• git push -u origin “nome da nova branch”
13
Git e Github
2 4
• Importando repositórios (Clone e Pull) 3 34-
14 .
6 .8
• Pode ser útil trazer para seu computador arquivos 0 9 que estão no Github
• Uma forma de “baixar” tais arquivos éSpor l va
i meio da função clone
to s
a n
• Crie uma pasta em seu computador
o S
• Dentro da pasta, com eo D botão direito do mouse, abra o Git Bash Here
J o s
• No Github, no repositório
eg o de interesse, clique em code e copie o link
D i
• No Git, digite git clone ..........(link do repositório)..........
• Para baixar novamente, após alterações no Github, indique cd “repositório”
• Na sequencia, digite git pull (o arquivo foi atualizado no computador)
14
Git e Github
2 4
• Copiando repositórios públicos (Fork) 3 34-
14 .
6 .8
0
• É possível copiar repositórios que estão publicados 9 no Github
i l va
s S
• Procure por algum tema de interesse
n to
• Acesse o repositório S a
o
D existe o botão Fork
o s e
• No canto superior direito,
• Após clicar, poderá
o J ver o repositório em sua lista (em seu perfil)
i eg
D
15
Git, Github e RStudio
2 4
• É possível integrar o Git, Github e RStudio 3 34-
14 .
6 .8
09
lva → Version Control → Git
• No RStudio, clique em File → New Project
S i
ts
o
a n o link do repositório no Github
• Em “Repository URL” basta indicar
o S
e D
Jo s
• Após criar um documento
o (R Script, R Markdown), clique em Git e
faça o commiti ege, em seguida, o push
D
• Também é possível fazer o pull dos arquivos do repositório que foi indicado
16
2 4
3 34-
14 .
6 .8
a 09
l v
Si
os com Pacote Purrr
Funções e Iterações
n t
Sa
D o
s e
o Jo
i eg
D
17
Functions, Purrr
2 4
3 34-
14 .
• Criando funções no R
6 .8
• Atribuindo condições (“IF”)
a 09
l v
• Iterações com Purrr (funções map)
s Si
n to
• Material para referência: S a
D o
o s e
•
J
Wickham, H. & Grolemund,
o
G. R for Data Science: [Link]
•
eg
[Link]
i
D
18