Datenmatrix

Als Datenmatrix bezeichnet man die Anordnung der Daten vor allem (aber nicht nur) in Statistik-Programmen. Im Gegensatz zur Urliste beinhaltet die Datenmatrix nicht nur eine Variable, sondern alle erhobenen Variablen.

Hier im Beispiel: Es wurden Personen nach ihrem Alter, ihrem Schulabschluss und nach ihrer Lesehäufigkeit befragt. In dem unten dargestellten Beispiel liegen die Daten somit als Antworten zu den Fragen der Befragung vor.

Datenmatrix
Datenmatrix

In Statistikprogrammen wird in der Regel jedes erfragte Merkmal mit einer Kurzbezeichnung charakterisiert (z.B. V1 für Variable 1, etc.). Die Antworten der Befragten werden in je einer Zeile festgehalten; d.h. die Rohdaten einer Datenerhebung werden codiert, d.h. die Ausprägungen der Merkmale werden als Zahlen dargestellt. Anstatt der Bezeichnung der Beobachtungseinheiten wird in der Regel der Laufindex \(i\) für die Fallnummer genutzt, oder zur besseren Identifikation der Fälle ein persönlicher Codewert für jeden einzelnen Fall genutzt.

Für die Variable Alter wird das erhobene Alter als Zahl übernommen, beim Schulabschluss wird dies der Reihenfolge nach kodiert: Abitur (\(3\)), Realschule (\(2\)), Hauptschule (\(1\)). Es wird hier also eine Ordnung vorgenommen, wobei die höchste Zahl dem höchsten Schulabschluss zugeordnet wird. Auch die Lesehäufigkeit wurde als ordinales Skalenniveau Zahlenwerte zugeordnet: sehr oft (\(4\)), oft (\(3\)), selten (\(2\)) und nie (\(1\)).

Datenmatrix
Datenmatrix