Agora você vai aprender sobre a estrutura de uma tabela de dados. Na captura de tela abaixo, você verá o conjunto de dados do PSS limitado às quatro perguntas de exemplo (variáveis) da página anterior.
Se você observar mais de perto a variável stfdem
, verá que apenas valores numéricos estão inseridos lá. Mesmo para os códigos 0
e 10
, não foi utilizada a descrição de valor do PDF, mas sim o código! Isso é uma descoberta importante. Pois somente quando valores numéricos são usados em todas as categorias, a variável pode ser considerada de nível de escala métrica e armazenada em um vetor numeric ou integer. Pois: Todas as análises estatísticas requerem vetores numeric ou integer, já que não é possível calcular desvio padrão com letras.
Agora que você entende como uma tabela de dados é estruturada, o que está nas linhas, colunas e células. No R, essas tabelas de dados são armazenadas como objetos do tipo data frame.
No Environment, você pode ver que isso está sob o grupo data. Você também pode ver que o objeto é expansível. Ao clicar na seta, todas as variáveis (cada uma com um $
na frente) contidas nesse novo objeto são exibidas. Portanto, é fácil entender que um data frame é simplesmente a compilação de todas as variáveis (ou vetores no R) de uma pesquisa.
Com um clique duplo, você pode abrir a visualização dos dados. Isso é simplesmente a tabela de dados, como discutido anteriormente. As variáveis estão nas colunas e os casos nas linhas (exceto a primeira linha!).
Mas como você manipula um conjunto de dados no R?