next up previous index
Nächste Seite: Cramers Aufwärts: Tabellenanalyse Vorherige Seite: Kreuzproduktverhältnis (Odds Ratio)   Index

Pearsons $ X^{2}$

Pearsons $ X^{2}$ (engl.: Pearson's $ X^{2}$) ist ein »Assoziationsmaß« für »kategoriale Variablen«. Ausgangspunkt ist eine »Kreuztabelle« zweier Variablen $ X$ und $ Y$. Diese Tabelle, die sogenannte Kontingenztabelle, mit den in der Stichprobe beobachteten Häufigkeiten $ f_{ij}$, wird mit einer sogenannten Indifferenztabelle verglichen, die die erwarteten Häufigkeiten $ F_{ij}$ enthält, mit denen die jeweiligen Ausprägungskombinationen auftreten müßten, wären $ X$ und $ Y$ in der »Grundgesamtheit« statistisch voneinander unabhängig. Da die Verhältnisse in der Grundgesamtheit aber unbekannt sind (es sei denn, man macht eine »Totalerhebung«), muß man die erwarteten Häufigkeiten mit Hilfe von Informationen aus der Stichprobe schätzen. Man verwendet dazu die Randhäufigkeiten der Kreuztabelle und berechnet nach einer bestimmten Formel sogenannte geschätzte erwartete Häufigkeiten $ \hat F_{ij}$.

Die Abweichung der beobachteten von der geschätzten erwarteten Häufigkeit einer Ausprägungskombination, genauer gesagt: den Quotienten $ e_{ij}=(f_{ij}- \hat F_{ij})/\sqrt {\hat F_{ij}}$, bezeichnet man als standardisiertes Residuum $ e_{ij}$ der Ausprägungskombination $ ij$. Es zeigt, wie sehr die jeweilige Zellenhäufigkeit vom Modell statistischer Unabhängigkeit abweicht. Pearsons $ X^{2}$ entspricht der Summe der quadrierten standardisierten Residuen aller Tabellenzellen. Anders ausgedrückt: $ X^{2}$ ist ein Maß für die Abweichungen der Vorhersagen des Modells statistischer Unabhängigkeit von den empirischen Daten - kurz: ein Maß für die Modellanpassung.

Der Wertebereich von $ X^{2}$ geht von 0 bis $ X^{2}_{max}$. Der Wert 0 bedeutet, daß $ X$ und $ Y$ statistisch voneinander unabhängig sind. Je größer der statistische Zusammenhang zwischen beiden Variablen ist, desto größer ist auch $ X^{2}$. $ X^{2}$ und alle darauf aufbauenden Assoziationsmaße (z.B. »Cramers $ V$«) sind richtungslose Maßzahlen, die keinen Hinweis auf die Richtung des Zusammenhangs geben. Da Pearsons $ X^{2}$ der Summe der quadrierten standardisierten Residuen aller Tabellenzellen entspricht, ist seine Maßeinheit aber kaum anschaulich zu interpretieren. Die Interpretation wird zusätzlich dadurch erschwert, daß $ X^{2}$ eine variable Obergrenze aufweist, die mit dem Stichprobenumfang und der Anzahl der Ausprägungen der beiden Variablen zunimmt.[*] Man kann daher nicht ohne weiteres sagen, ob ein konkreter $ X^{2}$-Wert groß oder klein ist. Zwei Alternativen bieten sich an:

Unter bestimmten Bedingungen kann man für die zweite Alternative näherungsweise die »$ \chi^{2}$-Verteilung« (sprich: Chi-Quadrat-Verteilung) verwenden und auf diese Weise feststellen, ob ein konkreter $ X^{2}$-Wert eher zu den häufiger vorkommenden (wahrscheinlichen) oder eher zu den selteneren (unwahrscheinlichen) $ X^{2}$-Werten zählt. Um von einem statistischen Zusammenhang von $ X$ und $ Y$ sprechen zu können, müßte $ X^{2}$ so groß sein, daß es eher zu den unwahrscheinlichen Werten gehört. Nach dieser Logik funktioniert der »Chi-Quadrat-Unabhängigkeitstest«.

In der Literatur wird $ X^{2}$ häufig als Pearsons Chi-Quadrat oder kurz: als Chi-Quadrat bezeichnet. Das kommt daher, daß in entsprechenden Tests auf statistische Unabhängigkeit in Kreuztabellen die »$ \chi^{2}$-Verteilung« als Prüfverteilung verwendet wird. Wenn man aber $ X^{2}$ als Chi-Quadrat bezeichnet, eventuell sogar noch mit $ \chi^{2}$ (griech.: chi) abkürzt, dann entsteht der (falsche) Eindruck, daß $ X^{2}$ und die »Zufallsvariable« $ \chi^{2}$, die das Ergebnis eines (hypothetischen) Zufallsexperiments ist und deren Verteilung durch die $ \chi^{2}$-Verteilung beschrieben wird, identisch seien. Es ist jedoch wichtig festzustellen, daß $ X^{2}$ und $ \chi^{2}$ sich erstens nur näherungsweise gleich verhalten und dieses zweitens auch nur unter bestimmten Bedingungen. $ X^{2}$ ist eigentlich nur eine von Karl Pearson (1857-1936) vorgeschlagene Maßzahl für die Abweichungen zwischen Kontingenz- und Indifferenztabelle, die mit der Zufallsvariablen $ \chi^{2}$ erst einmal nichts zu tun hat. Wir bezeichnen sie daher mit Pearsons $ X^{2}$.

Notation: $ X^{2}$.


next up previous index
Nächste Seite: Cramers Aufwärts: Tabellenanalyse Vorherige Seite: Kreuzproduktverhältnis (Odds Ratio)   Index
HJA 2001-10-01