\(\chi^2\) (Chi-Quadrat) weist drei Probleme auf. Erstens ist \(\chi^2\) (Chi-Quadrat) abhängig von den absoluten Häufigkeiten. Verdoppeln sich bspw. die Häufigkeiten, so verdoppelt sich auch \(\chi^2\) (Chi-Quadrat). Die prozentuale Verteilung ändert sich jedoch nicht. Alternativ könnte der \(\chi^2\) (Chi-Quadrat)-Wert normiert werden.
Für die zwei unten erklärten berechneten Koeffizienten finden Sie auf der nächsten Seite Rechenbeispiele in Lernvideos.
Nur für 2x2-Kreuztabellen (wie im Beispiel) bietet sich \(\phi\) (Phi) an. Das Ziel von \(\phi\) (Phi) ist die Relativierung von \(\chi^2\) (Chi-Quadrat) für die Anzahl von Beobachtungen. Je größer \(\phi\) (Phi), desto stärker ist der Zusammenhang zwischen den beiden Variablen. \(\phi\) (Phi) variiert zwischen \(0\) (min.) und \(1\) (max.) (\(\phi \in [0;1]\)).
Die Formel zur Berechnung von \(\phi\) (Phi) lautet:
\(\phi = \sqrt \frac{\chi^2}{n}\), wobei \(\phi \in [0;1]\)
Im vorherigen Beispiel ergibt sich daher:
\[\begin{align*} \phi &= \sqrt \frac{\chi^2}{n} \\ &=\sqrt \frac{252.53}{1000} \\ &\approx 0.503 \end{align*}\]
Zweiten ist \(\chi^2\) (Chi-Quadrat) abhängig von der Kategorienanzahl pro Tabelle. Drittens lassen sich Kontingenzkoeffizienten aus Tabellen unterschiedlicher Größe schwierig miteinander vergleichen. Diese Fehler behebt die Berechnung von Cramer´s V. Formal wird der \(\chi^2\) (Chi-Quadrat)-Wert durch den maximal erreichbaren \(\chi_{max}^2\) (Chi-Quadrat)-Wert dividiert.
Für Mehrfeldertabellen gilt:
\(\chi_{max}^2 = n \ast (R-1)\), wobei \(R\) die minimale Spalten- bzw. Zeilenzahl ist.
Die Formel für Cramer´s V ist daher:
\(V = \sqrt \frac {\chi^2}{\chi_{max}^2}= \sqrt \frac {\chi^2}{n \ast (min(k, m)-1)}\), wobei \(V \in [0;1]\), wobei \(n\): Anzahl Beobachtungen; \(k\): Anzahl Spalten; \(m\): Anzahl Zeilen
Der Wertebereich von Cramer´s V beträgt \(0\) bis \(1\). Für die Interpretation der Werte gibt es Konventionen:
Um die Probleme von \(\chi^2\) (Chi-Quadrat) zu umgehen, wird am häufigsten Cramer’s V genutzt, da diese Maßzahl alle drei Probleme umgeht.
Im Beispiel ergibt sich für uns folgender Wert von Cramer´s V:
Die Anzahl der Beobachtungen ist: \(n = 1000\)
Die Anzahl der Spalten ist: \(k = 2\)
Die Anzahl der Zeilen ist: \(m = 2\)
Da die Anzahl der Spalten und Zeilen gleich ist, können wir entweder \(m\) oder \(k\) benutzen. Ist die Anzahl nicht gleich, muss der kleinere Wert genutzt werden.
\[ \begin{align*} V &= \sqrt \frac {\chi^2}{\chi_{max}^2} \\ &= \sqrt \frac {\chi^2}{n \ast (min(k, m)-1)} \\&= \sqrt \frac{252.53}{1000 \ast (2-1)} \\ &\approx 0.503 \end{align*}\]
Cramer´s V gibt einen Wert von \(0,387\) aus und damit laut obigen Konventionen einen mittleren Zusammenhang zwischen den zwei Variablen. Im Beispiel ist der Wert von Cramer´s V dem Wert von \(\phi\) (Phi) gleich, da es sich um eine 2x2-Tabelle handelt.
In diesem Lernvideo wird Ihnen die Berechnung von \(\chi^2\) sowie der Koeffizienten \(\phi\) und Cramers V anhand zweier Beispiel gezeigt.