Deskriptive Statistik

Struktur und Informationen eines Datensatzes

Als erstes probieren wir aber das vorhin gelernte aus und laden nun den Datensatz pss in das Environment! In RStudio Cloud ist der Datensatz bereits in deinem Ordner data. Arbeitest du lokal mit RStudio findest du den Datensatz und das Codebook hier:

  • PSS_Codebook.pdf (94 KB)
  • pss.rds (63 KB)
  • Lade den Datensatz in das Environment hinein!

    pss <- readRDS("./data/pss.rds")

    Zur Erinnerung: Mit der Funktion head() können wir einen ersten Einblick in die Daten bekommen (die ersten \(6\) Fälle):

    head(pss)

    Variablen und Skalenniveau

    Im Datensatz PSS sind eine Reihe von Variablen vorhanden. Zum Datensatz gibt es ein Codebook, dass in der RStudio Cloud gespeichert ist bzw. über den oberen Link herunterzuladen ist. Überlege kurz zu den folgenden Variablen, welches Skalenniveau diese aufweisen und welcher Datentyp in R dafür geeignet wäre.

    Variablen im Datensatz pss:

    • wkhtot

    • gndr

    • stfdem

    • trstprl

    Die Variablen haben folgendes Skalenniveau:

    • wkhtot: metrisch

    • gndr: nominal

    • stfdem: (pseudo-)metrisch / ordinal

    • trstprl: (pseudo-)metrisch / ordinal

    
    str(pss$wkhtot)
    

    str(pss$gndr)

    str(pss$stfdem)

    str(pss$trstprl)

    Bei allen Variablen passt der Datentyp zum Skalenniveau.

    Länge eines Vektors

    Um die Länge eines Vektors auszugeben, wird die Funktion length() genutzt. Diese Funktion gibt die Anzahl der Werte in einem Vektor an. Im Fall einer Variable also die Anzahl an Beobachtungen in einer Variable.

    length(pss$edu)
    Können wir auf die Länge der anderen Vektoren schließen, oder müssen wir uns diese auch nochmal ausgeben lassen?

    Alternativ kann man die Länge auch über die Funktion dim() herausfinden. Hierbei muss aber das data frame-Objekt aufgerufen werden.

    dim(pss)
    ## [1] 5000   14

    Die erste Dimension sind die Zeilen (Fälle), die zweite Dimension sind die Spalten (Variablen).

    Gehen wir weiter und lassen uns Maße der zentralen Tendenz ausgeben!