Die folgenden zwei Datensätze zeigen Daten, die jeweils nicht tidy sind. Wir werden diese im Folgenden bereinigen.
statclass
## name stat1 stat2 r spss
## 1 momo 12 5 6 9
## 2 kim 14 10 13 15
## 3 sascha 7 4 4 1
Dieser Datensatz ist im sogenannten wide-Format. D.h. wenn wir neue Prüfungen hätten, würden wir einfach weitere Spalten hinzufügen. Dies ist aber für die Verarbeitung mit R teilweise problematisch, denn wir benötigen oft ein long-Format.
statclass2
In diesem Fall haben wir mehrere Probleme: Zum einen sind in den Spalten nicht überall Variablen, sondern Beobachtungen (momo
, kim
, sascha
) und in exam
finden wir wiederum Variablennamen.
Fangen wir mit statclass
an.