Mas antes de tudo, vamos aplicar o que aprendemos anteriormente e carregar o conjunto de dados pss no ambiente! No RStudio Cloud, o conjunto de dados já está em sua pasta data. Se estiver trabalhando localmente com o RStudio, você encontrará o conjunto de dados e o livro de códigos aqui:
Carregue o conjunto de dados no ambiente!
pss <- readRDS("./data/pss.rds")
Como lembrete: Com a função head() podemos ter uma primeira visão dos dados (os primeiros \(6\) casos):
head(pss)
No conjunto de dados PSS, existem várias variáveis. Há um livro de códigos para o conjunto de dados, que está armazenado no RStudio Cloud ou pode ser baixado através do link acima. Pense brevemente sobre as seguintes variáveis, qual nível de escala elas possuem e qual tipo de dado em R seria adequado para elas.
Variáveis no conjunto de dados pss:
wkhtot
gndr
stfdem
trstprl
As variáveis têm os seguintes níveis de escala:
wkhtot: métrica
gndr: nominal
stfdem: (pseudo-)métrica / ordinal
trstprl: (pseudo-)métrica / ordinal
str(pss$wkhtot)
str(pss$gndr)
str(pss$stfdem)
str(pss$trstprl)
Todos os tipos de dados das variáveis correspondem ao nível de escala.
Para exibir o comprimento de um vetor, utiliza-se a função length(). Esta função fornece o número de valores em um vetor. No caso de uma variável, representa o número de observações em uma variável.
length(pss$edu)
Alternativamente, o comprimento também pode ser determinado usando a função dim(). Nesse caso, o objeto data frame deve ser chamado.
dim(pss)
## [1] 5000 14
A primeira dimensão são as linhas (casos), a segunda dimensão são as colunas (variáveis).
Vamos continuar e exibir medidas de tendência central!