Tidyverse é um pacote que contém várias bibliotecas que funcionam com uma sintaxe semelhante e são compatíveis entre si. Ele oferece uma ampla gama de funcionalidades e, portanto, é amplamente utilizado.
Tidyverse inclui pacotes principais, todos carregados com o comando library("tidyverse")
. Estes são:
dplyr (Limpeza de dados)
tidyr (Manipulação de conjuntos de dados)
ggplot2 (Gráficos)
stringr (Manipulação de dados de texto)
forcats (Manipulação de fatores)
tibble (Ferramenta de tabela)
readr (Importação de dados)
purrr (Manipulação de funções e vetores)
Ao longo deste bloco de aprendizado, você aprenderá sobre dplyr
e tidyr
!
Para todas as bibliotecas tidyverse
, existem documentações extensas e também folhas de dicas curtas. As folhas de dicas para as duas bibliotecas apresentadas aqui podem ser encontradas aqui:
dplyr
inclui uma gramática para fazer manipulações de dados. Ele se destaca por sua simplicidade e pela capacidade de combinar comandos básicos. Geralmente é útil para uma primeira análise de dados ou para reestruturar (manipular) os dados.
tidyr
inclui uma gramática para transformar conjuntos de dados em um formato tidy. O objetivo é que cada coluna seja uma variável, cada linha seja uma observação e cada célula contenha um valor. Aqui está o link para tidyr
.
Agora você pode começar com o dplyr
!