Mas antes de tudo, vamos aplicar o que aprendemos anteriormente e carregar o conjunto de dados pss
no ambiente! No RStudio Cloud, o conjunto de dados já está em sua pasta data
. Se estiver trabalhando localmente com o RStudio, você encontrará o conjunto de dados e o livro de códigos aqui:
Carregue o conjunto de dados no ambiente!
pss <- readRDS("./data/pss.rds")
Como lembrete: Com a função head()
podemos ter uma primeira visão dos dados (os primeiros \(6\) casos):
head(pss)
No conjunto de dados PSS, existem várias variáveis. Há um livro de códigos para o conjunto de dados, que está armazenado no RStudio Cloud ou pode ser baixado através do link acima. Pense brevemente sobre as seguintes variáveis, qual nível de escala elas possuem e qual tipo de dado em R seria adequado para elas.
Variáveis no conjunto de dados pss
:
wkhtot
gndr
stfdem
trstprl
As variáveis têm os seguintes níveis de escala:
wkhtot
: métrica
gndr
: nominal
stfdem
: (pseudo-)métrica / ordinal
trstprl
: (pseudo-)métrica / ordinal
str(pss$wkhtot)
str(pss$gndr)
str(pss$stfdem)
str(pss$trstprl)
Todos os tipos de dados das variáveis correspondem ao nível de escala.
Para exibir o comprimento de um vetor, utiliza-se a função length()
. Esta função fornece o número de valores em um vetor. No caso de uma variável, representa o número de observações em uma variável.
length(pss$edu)
Alternativamente, o comprimento também pode ser determinado usando a função dim()
. Nesse caso, o objeto data frame deve ser chamado.
dim(pss)
## [1] 5000 14
A primeira dimensão são as linhas (casos), a segunda dimensão são as colunas (variáveis).
Vamos continuar e exibir medidas de tendência central!