Multivariate lin. Regression mit dichotomen kategoriellen Variablen

In den Sozialwissenschaften nutzen wir oftmals Variablen mit nominalem oder ordinalem Skalenniveau. Diese können wir auch in das lineare Regressionsmodell als unabhängige Variable hinzufügen. Wir müssen nur verstehen, welchen zusätzlichen Effekt wir berechnen. Wir müssen Dummy-Variablen kreieren, die den Unterschied einer Ausprägung auf der Variablen in Referenz zu einer anderen Ausprägung angeben (Referenzkategorie).

Wir möchten die Variable gndr mit in unser Modell aufnehmen (female/male). Welche theoretische Annahme können wir über den Effekt treffen?

Was gleichen wir in der Regressionsgleichung an?

Wie wir bereits wissen, hat eine dichotome Variable keine lineare Beziehung zu einer metrischen Variable. Deshalb benötigen wir Dummy-Variablen. Wir berechnen ein Modell, in dem der zusätzliche Effekt einer Ausprägung gegenüber der anderen Ausprägung geschätzt wird. Dieser Effekt ist ein konstanter Effekt!.

Die Variable gndr hat folgende Ausprägungen:

  • female

  • male

Zuerst schaffen wir nun in SPSS Dummy-Variablen. Dabei entstehen so viele Dummies wie die Variable Ausprägungen hat. In die Regression nehmen wir aber nur eine dieser Dummy-Variablen auf.

Klickweg

In der Syntax benutzen wir wieder RECODE und nicht den spezifischen Befehl aus dem Klickweg.

RECODE gndr ('female' = 1) ('male' = 0) INTO female.
RECODE gndr ('female' = 0) ('male' = 1) INTO male.

Die neue Variable ist wie beim Klickweg mit 0/1 codiert. Hier haben wir die Variablen intuitiver benannt, so dass wir wissen, welche Variable welches Geschlecht anzeigt.

Ergebnis

Berechnen des Modells

Auch hier müssen wir nun eine der neu geschaffenen Variable für Geschlecht hinzufügen. Wir entscheiden uns, dass männlich die Referenzkategorie ist und inkludieren die Variable gndr_1 bzw female.

Klickweg

REGRESSION
/MISSING LISTWISE 
/STATISTICS COEFF R ANOVA CI(95)
/NOORIGIN
/DEPENDENT stfdem
/METHOD=ENTER stfeco trstlgl gndr_1.

Ergebnis

Wie interpretieren wir das Modell? Schreibe ein paar Zeilen in das Skript!
Wenn du jetzt nochmal die Formel oben vergleichst mit der Aufgabe, sollte dir etwas auffallen! Was muss an der Formel geändert werden, damit diese tatsächlich auf das Regressionmodell passt?

Im letzten Schritt wenden wir dies nun nur noch auf eine Variable mit mehr als zwei Ausprägungen aus. Danach kannst du alle wichtigen Schritte zur Durchführung einer linearen Regression in SPSS.