Beispiel gleiche Varianzen

Kommen wir nun zu einem Rechenbeispiel des zweiseitigen t-Tests für unabhängige Stichproben mit gleichen Varianzen. Als Beispiel übernehmen wir die Fragestellung, die wir eingangs als Beispiel benannt haben: Weisen Frauen und Männer einen unterschiedlichen Mittelwert bei der wöchentlichen Arbeitszeit auf? Falls ja, sind diese Unterschiede statistisch signifikant?

Aus einem Survey haben wir folgende Daten:

Frauen: xˉ1=34.14084,s1=10.89673,n1=884\bar{x}_1 = 34.14084, s_1 = 10.89673, n_1 = 884

Männer: xˉ2=43.64809,s2=9.541511,n2=1023\bar{x}_2 = 43.64809, s_2 = 9.541511, n_2 = 1023

Die Hypothesen zum Hypothesentest lauten: H0:μ1=μ2H_0: \mu_1 = \mu_2, Die Mittelwerte der Stichproben unterscheidet sich nicht. H1:μ1μ2H_1: \mu_1 \neq \mu_2, Die Mittelwerte der Stichproben unterscheiden sich, sind nicht gleich.

Aus dem Hypothesen folgt, dass wir annehmen: μ1μ2=0\mu_1 - \mu_2 = 0

Die Formel zur Berechnung des unabhängigen t-Tests mit gleichen Varianzen ist:

temp=xˉ1xˉ2σ^(xˉ1xˉ2)t_{emp} = \frac{\bar{x}_1 - \bar{x}_2}{\hat{\sigma}_{(\bar{x}_1 - \bar{x}_2)}}

Vereinfacht ausgedrückt berechnet die Prüfgröße:

temp=MittelwertdifferenzderStichprobenStandardfehlerderMittelwertdifferenzt_{emp} = \frac{Mittelwertdifferenz \, der \, Stichproben}{Standardfehler \, der \, Mittelwertdifferenz}

Der Standardfehler der Mittelwertdifferenz berechnet sich wie folgt:

σ^(xˉ1xˉ2)=(n11)s12+(n21)s22n1+n221n1+1n2\hat{\sigma}_{(\bar{x}_1 - \bar{x}_2)} = \sqrt{\frac{(n_1 - 1)*s^2_1 + (n_2 - 1)*s^2_2}{n_1 + n_2 -2}} * \sqrt{ \frac{1}{n_1} + \frac{1}{n_2}}

Nun muss nur noch die Anzahl der Freiheitsgrade errechnet werden, um den kritischen tt-Wert bestimmen zu können:

ν=n1+n22\nu = n_1 + n_2 -2

Nun setzen wir die Werte in die Formel ein:

σ^(xˉ1xˉ2)=(8841)10.896732+(10231)9.5415112884+102321884+110230.468\hat{\sigma}_{(\bar{x}_1 - \bar{x}_2)}= \sqrt{\frac{(884 - 1)*10.89673^2 + (1023 - 1)*9.541511^2}{884 + 1023 - 2}} * \sqrt{\frac{1}{884} + \frac{1}{1023}} \approx 0.468

temp=34.1408443.648090.46820.313t_{emp} = \frac {34.14084 - 43.64809}{0.468} \approx -20.313

ν=n1+n22=884+10232=1905\nu = n_1 + n_2 - 2 = 884 + 1023 - 2 = 1905

Nun müssen wir den Betrag der Prüfgröße (temp|t_{emp}|) gegenüber dem kritischen Wert prüfen. Wir prüfen auf das konventionellen 95%95\%-Niveau und haben insgesamt 19051905 Freiheitsgrade (ν\nu). Wir führen einen zweiseitigen Test durch. Da die meisten tt-Tabellen nur bis 10001000 Freiheitsgrade verzeichnet sind, nehmen wir approximativ den kritischen Wert an der Stelle tkrit(ν=1000;p=0.975)t_{krit(\nu=1000; p = 0.975)}.

Der kritische Wert beträgt an der genannten Stelle:

tkrit(ν=1000;p=0.975)=1.962t_{krit_{(\nu=1000; p=0.975)}} = 1.962.

Damit das errechnete Ergebnis der Signifikanz gilt, muss:

temp>tkrit|t_{emp} | > t_{krit}

Im Beispiel ist dies erfüllt: 20.313>1.962|-20.313| > 1.962

Wir können somit schlussfolgern, dass Frauen im Mittel 6.9096.909 Stunden weniger als Männer in Erwerbsarbeit tätig sind.

Hier ein weiteres Beispiel im Video: