Estatística Descritiva

Estrutura e Informações de um Conjunto de Dados

Mas antes de tudo, vamos aplicar o que aprendemos anteriormente e carregar o conjunto de dados pss no ambiente! No RStudio Cloud, o conjunto de dados já está em sua pasta data. Se estiver trabalhando localmente com o RStudio, você encontrará o conjunto de dados e o livro de códigos aqui:

  • PSS_Codebook.pdf (94 KB)
  • pss.rds (63 KB)
  • Carregue o conjunto de dados no ambiente!

    pss <- readRDS("./data/pss.rds")

    Como lembrete: Com a função head() podemos ter uma primeira visão dos dados (os primeiros \(6\) casos):

    head(pss)

    Variáveis e Nível de Escala

    No conjunto de dados PSS, existem várias variáveis. Há um livro de códigos para o conjunto de dados, que está armazenado no RStudio Cloud ou pode ser baixado através do link acima. Pense brevemente sobre as seguintes variáveis, qual nível de escala elas possuem e qual tipo de dado em R seria adequado para elas.

    Variáveis no conjunto de dados pss:

    • wkhtot

    • gndr

    • stfdem

    • trstprl

    As variáveis têm os seguintes níveis de escala:

    • wkhtot: métrica

    • gndr: nominal

    • stfdem: (pseudo-)métrica / ordinal

    • trstprl: (pseudo-)métrica / ordinal

    
    str(pss$wkhtot)
    

    str(pss$gndr)

    str(pss$stfdem)

    str(pss$trstprl)

    Todos os tipos de dados das variáveis correspondem ao nível de escala.

    Comprimento de um vetor

    Para exibir o comprimento de um vetor, utiliza-se a função length(). Esta função fornece o número de valores em um vetor. No caso de uma variável, representa o número de observações em uma variável.

    length(pss$edu)
    Podemos inferir o comprimento dos outros vetores, ou precisamos exibi-los novamente?

    Alternativamente, o comprimento também pode ser determinado usando a função dim(). Nesse caso, o objeto data frame deve ser chamado.

    dim(pss)
    ## [1] 5000   14

    A primeira dimensão são as linhas (casos), a segunda dimensão são as colunas (variáveis).

    Vamos continuar e exibir medidas de tendência central!