In den Sozialwissenschaften nutzen wir oftmals Variablen mit nominalem oder ordinalem Skalenniveau. Diese können wir auch in das lineare Regressionsmodell als unabhängige Variable hinzufügen. Wir müssen nur verstehen, welchen zusätzlichen Effekt wir berechnen. Wir müssen Dummy-Variablen kreieren, die den Unterschied einer Ausprägung auf der Variablen in Referenz zu einer anderen Ausprägung angeben (Referenzkategorie).
Wir möchten die Variable gndr
mit in unser Modell aufnehmen (female/male). Welche theoretische Annahme können wir über den Effekt treffen?
Wie wir bereits wissen, hat eine dichotome Variable keine lineare Beziehung zu einer metrischen Variable. Deshalb benötigen wir Dummy-Variablen. Wir berechnen ein Modell, in dem der zusätzliche Effekt einer Ausprägung gegenüber der anderen Ausprägung geschätzt wird. Dieser Effekt ist ein konstanter Effekt!.
Die Variable gndr
hat folgende Ausprägungen:
female
male
Zuerst schaffen wir nun in SPSS Dummy-Variablen. Dabei entstehen so viele Dummies wie die Variable Ausprägungen hat. In die Regression nehmen wir aber nur eine dieser Dummy-Variablen auf.
In der Syntax benutzen wir wieder RECODE
und nicht den spezifischen Befehl aus dem Klickweg.
RECODE gndr ('female' = 1) ('male' = 0) INTO female.
RECODE gndr ('female' = 0) ('male' = 1) INTO male.
Die neue Variable ist wie beim Klickweg mit 0
/1
codiert. Hier haben wir die Variablen intuitiver benannt, so dass wir wissen, welche Variable welches Geschlecht anzeigt.
Auch hier müssen wir nun eine der neu geschaffenen Variable für Geschlecht hinzufügen. Wir entscheiden uns, dass männlich die Referenzkategorie ist und inkludieren die Variable gndr_1
bzw female
.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF R ANOVA CI(95)
/NOORIGIN
/DEPENDENT stfdem
/METHOD=ENTER stfeco trstlgl gndr_1.
Im letzten Schritt wenden wir dies nun nur noch auf eine Variable mit mehr als zwei Ausprägungen aus. Danach kannst du alle wichtigen Schritte zur Durchführung einer linearen Regression in SPSS.