No R, você geralmente trabalha com dados já coletados. No entanto, para entender melhor o objeto data frame, nesta página você poderá seguir os passos da coleta de dados ao conjunto de dados. Isso ajudará você a compreender melhor o objeto data frame no R.
Mais adiante, usaremos um conjunto de dados de treinamento fictício chamado Panem Social Survey, inspirado no European Social Survey. A vantagem é que você poderá praticar primeiro com um conjunto de dados de treinamento muito menor antes de trabalharmos com conjuntos de dados reais (maiores) presencialmente. Você já encontrará o conjunto de dados e o codebook do PSS no projeto do RStudio. Se desejar salvá-lo manualmente em seu computador, você pode encontrá-lo aqui:
Também nos anexos, você encontrará um PDF com o nome from-survey-to-data.pdf
. Faça o download e dê uma olhada!
No arquivo há um trecho de quatro perguntas (variáveis do conjunto de dados) que foram coletadas neste conjunto de dados fictício. Dica: No Codebook, você obterá informações mais detalhadas sobre o tipo de medição de cada variável.
Como você já deve ter entendido, um conjunto de dados não é nada mais do que uma coleção de várias variáveis de pessoas entrevistadas que são processadas em conjunto. Portanto, conjuntos de dados são processados ou lidos em forma de tabelas. Essas tabelas de dados têm duas dimensões: Linhas e Colunas.
Você aprenderá sobre a estrutura de uma tabela de dados na próxima página.