In R bearbeitest du meistens bereits erhobene Daten. Um aber das Objekt data frame besser zu verstehen, wirst du auf dieser Seite die Schritte von der Datenerhebung zum Datensatz nachvollziehen können. Das hilft dir dabei, das Objekt data frame in R besser zu verstehen.
Im weiteren Verlauf nutzen wir einen fiktiven Trainingsdatensatz Panem Social Survey, der angelehnt an den European Social Survey ist. Vorteil ist, dass du erstmal mit einem deutlich kleineren Trainingsdatensatz üben kannst, bevor wir mit richtigen (größeren) Datensätzen in der Präsenz arbeiten. Den Datensatz und das Codebook des PSS findest du bereits im RStudio Projekt. Falls du es nochmal manuell lokal auf deinem Rechner speichern möchtest, findest du es hier:
Ebenso findest du in den Attachments eine PDF mit dem Namen from-survey-to-data.pdf
. Lade diese herunter und schau sie dir an!
In der Datei ist ein Auszug von vier Fragen (Variablen aus dem Datensatz), die in diesem fiktiven Datensatz erhoben wurden. Tipp: Im Codebook erhältst du genauere Informationen zu der Art der Messung der einzelnen Variablen.
Wie du jetzt sicher schon verstanden hast, ist ein Datensatz nichts anderes als eine Sammlung mehrerer Variablen von befragten Personen, die zusammen verarbeitet werden. Deshalb werden Datensätze in Tabellenform verarbeitet bzw. gelesen. Diese Datentabellen haben zwei Dimensionen: Zeilen und Spalten.
Den Aufbau einer Datentabelle lernst du auf der nächsten Seite kennen.