Als erstes probieren wir aber das vorhin gelernte aus und laden nun den Datensatz pss
in das Environment! In RStudio Cloud ist der Datensatz bereits in deinem Ordner data
. Arbeitest du lokal mit RStudio findest du den Datensatz und das Codebook hier:
Lade den Datensatz in das Environment hinein!
pss <- readRDS("./data/pss.rds")
Zur Erinnerung: Mit der Funktion head()
können wir einen ersten Einblick in die Daten bekommen (die ersten \(6\) Fälle):
head(pss)
Im Datensatz PSS sind eine Reihe von Variablen vorhanden. Zum Datensatz gibt es ein Codebook, dass in der RStudio Cloud gespeichert ist bzw. über den oberen Link herunterzuladen ist. Überlege kurz zu den folgenden Variablen, welches Skalenniveau diese aufweisen und welcher Datentyp in R dafür geeignet wäre.
Variablen im Datensatz pss
:
wkhtot
gndr
stfdem
trstprl
Die Variablen haben folgendes Skalenniveau:
wkhtot
: metrisch
gndr
: nominal
stfdem
: (pseudo-)metrisch / ordinal
trstprl
: (pseudo-)metrisch / ordinal
str(pss$wkhtot)
str(pss$gndr)
str(pss$stfdem)
str(pss$trstprl)
Bei allen Variablen passt der Datentyp zum Skalenniveau.
Um die Länge eines Vektors auszugeben, wird die Funktion length()
genutzt. Diese Funktion gibt die Anzahl der Werte in einem Vektor an. Im Fall einer Variable also die Anzahl an Beobachtungen in einer Variable.
length(pss$edu)
Alternativ kann man die Länge auch über die Funktion dim()
herausfinden. Hierbei muss aber das data frame-Objekt aufgerufen werden.
dim(pss)
## [1] 5000 14
Die erste Dimension sind die Zeilen (Fälle), die zweite Dimension sind die Spalten (Variablen).
Gehen wir weiter und lassen uns Maße der zentralen Tendenz ausgeben!