Unidade 2 > Coleta de Dados & Conjuntos de Dados > Da Coleta de Dados ao Conjunto de Dados > Conjunto de Dados em Data Frame

conjunto de dados data frame

Conjunto de Dados em Data Frame

Agora você vai aprender sobre a estrutura de uma tabela de dados. Na captura de tela abaixo, você verá o conjunto de dados do PSS limitado às quatro perguntas de exemplo (variáveis) da página anterior.

O que você pode observar na tabela? O que está nas colunas e o que está nas linhas?

Se você observar mais de perto a variável stfdem, verá que apenas valores numéricos estão inseridos lá. Mesmo para os códigos 0 e 10, não foi utilizada a descrição de valor do PDF, mas sim o código! Isso é uma descoberta importante. Pois somente quando valores numéricos são usados em todas as categorias, a variável pode ser considerada de nível de escala métrica e armazenada em um vetor numeric ou integer. Pois: Todas as análises estatísticas requerem vetores numeric ou integer, já que não é possível calcular desvio padrão com letras.

Em qual faixa de renda está a pessoa com o número de identificação 10020?

Agora que você entende como uma tabela de dados é estruturada, o que está nas linhas, colunas e células. No R, essas tabelas de dados são armazenadas como objetos do tipo data frame.

Exemplo de data frame no Environment

No Environment, você pode ver que isso está sob o grupo data. Você também pode ver que o objeto é expansível. Ao clicar na seta, todas as variáveis (cada uma com um $ na frente) contidas nesse novo objeto são exibidas. Portanto, é fácil entender que um data frame é simplesmente a compilação de todas as variáveis (ou vetores no R) de uma pesquisa.

Com um clique duplo, você pode abrir a visualização dos dados. Isso é simplesmente a tabela de dados, como discutido anteriormente. As variáveis estão nas colunas e os casos nas linhas (exceto a primeira linha!).

Exemplo de visualização de dados no R

Mas como você manipula um conjunto de dados no R?