Beispiel gleiche Varianzen

Kommen wir nun zu einem Rechenbeispiel des zweiseitigen t-Tests für unabhängige Stichproben mit gleichen Varianzen. Als Beispiel übernehmen wir die Fragestellung, die wir eingangs als Beispiel benannt haben: Weisen Frauen und Männer einen unterschiedlichen Mittelwert bei der wöchentlichen Arbeitszeit auf? Falls ja, sind diese Unterschiede statistisch signifikant?

Aus einem Survey haben wir folgende Daten:

Frauen: \(\bar{x}_1 = 34.14084, s_1 = 10.89673, n_1 = 884\)

Männer: \(\bar{x}_2 = 43.64809, s_2 = 9.541511, n_2 = 1023\)

Die Hypothesen zum Hypothesentest lauten: \(H_0: \mu_1 = \mu_2\), Die Mittelwerte der Stichproben unterscheidet sich nicht. \(H_1: \mu_1 \neq \mu_2\), Die Mittelwerte der Stichproben unterscheiden sich, sind nicht gleich.

Aus dem Hypothesen folgt, dass wir annehmen: \(\mu_1 - \mu_2 = 0\)

Die Formel zur Berechnung des unabhängigen t-Tests mit gleichen Varianzen ist:

\(t_{emp} = \frac{\bar{x}_1 - \bar{x}_2}{\hat{\sigma}_{(\bar{x}_1 - \bar{x}_2)}}\)

Vereinfacht ausgedrückt berechnet die Prüfgröße:

\(t_{emp} = \frac{Mittelwertdifferenz \, der \, Stichproben}{Standardfehler \, der \, Mittelwertdifferenz}\)

Der Standardfehler der Mittelwertdifferenz berechnet sich wie folgt:

\(\hat{\sigma}_{(\bar{x}_1 - \bar{x}_2)} = \sqrt{\frac{(n_1 - 1)*s^2_1 + (n_2 - 1)*s^2_2}{n_1 + n_2 -2}} * \sqrt{ \frac{1}{n_1} + \frac{1}{n_2}}\)

Nun muss nur noch die Anzahl der Freiheitsgrade errechnet werden, um den kritischen \(t\)-Wert bestimmen zu können:

\(\nu = n_1 + n_2 -2\)

Nun setzen wir die Werte in die Formel ein:

\(\hat{\sigma}_{(\bar{x}_1 - \bar{x}_2)}= \sqrt{\frac{(884 - 1)*10.89673^2 + (1023 - 1)*9.541511^2}{884 + 1023 - 2}} * \sqrt{\frac{1}{884} + \frac{1}{1023}} \approx 0.468\)

\(t_{emp} = \frac {34.14084 - 43.64809}{0.468} \approx -20.313\)

\(\nu = n_1 + n_2 - 2 = 884 + 1023 - 2 = 1905\)

Nun müssen wir den Betrag der Prüfgröße (\(|t_{emp}|\)) gegenüber dem kritischen Wert prüfen. Wir prüfen auf das konventionellen \(95\%\)-Niveau und haben insgesamt \(1905\) Freiheitsgrade (\(\nu\)). Wir führen einen zweiseitigen Test durch. Da die meisten \(t\)-Tabellen nur bis \(1000\) Freiheitsgrade verzeichnet sind, nehmen wir approximativ den kritischen Wert an der Stelle \(t_{krit(\nu=1000; p = 0.975)}\).

Der kritische Wert beträgt an der genannten Stelle:

\(t_{krit_{(\nu=1000; p=0.975)}} = 1.962\).

Damit das errechnete Ergebnis der Signifikanz gilt, muss:

\(|t_{emp} | > t_{krit}\)

Im Beispiel ist dies erfüllt: \(|-20.313| > 1.962\)

Wir können somit schlussfolgern, dass Frauen im Mittel \(6.909\) Stunden weniger als Männer in Erwerbsarbeit tätig sind.

Hier ein weiteres Beispiel im Video: