Conjunto de Dados em Data Frame

Agora você vai aprender sobre a estrutura de uma tabela de dados. Na captura de tela abaixo, você verá o conjunto de dados do PSS limitado às quatro perguntas de exemplo (variáveis) da página anterior.

O que você pode observar na tabela? O que está nas colunas e o que está nas linhas?

Se você observar mais de perto a variável stfdem, verá que apenas valores numéricos estão inseridos lá. Mesmo para os códigos 0 e 10, não foi utilizada a descrição de valor do PDF, mas sim o código! Isso é uma descoberta importante. Pois somente quando valores numéricos são usados em todas as categorias, a variável pode ser considerada de nível de escala métrica e armazenada em um vetor numeric ou integer. Pois: Todas as análises estatísticas requerem vetores numeric ou integer, já que não é possível calcular desvio padrão com letras.

Em qual faixa de renda está a pessoa com o número de identificação 10020?

Agora que você entende como uma tabela de dados é estruturada, o que está nas linhas, colunas e células. No R, essas tabelas de dados são armazenadas como objetos do tipo data frame.

Exemplo de data frame no Environment
Exemplo de data frame no Environment

No Environment, você pode ver que isso está sob o grupo data. Você também pode ver que o objeto é expansível. Ao clicar na seta, todas as variáveis (cada uma com um $ na frente) contidas nesse novo objeto são exibidas. Portanto, é fácil entender que um data frame é simplesmente a compilação de todas as variáveis (ou vetores no R) de uma pesquisa.

Com um clique duplo, você pode abrir a visualização dos dados. Isso é simplesmente a tabela de dados, como discutido anteriormente. As variáveis estão nas colunas e os casos nas linhas (exceto a primeira linha!).

Exemplo de visualização de dados no R
Exemplo de visualização de dados no R

Mas como você manipula um conjunto de dados no R?