Die Abweichung der beobachteten von der geschätzten erwarteten Häufigkeit einer Ausprägungskombination, genauer gesagt: den Quotienten
, bezeichnet man als standardisiertes Residuum
der Ausprägungskombination
. Es zeigt, wie sehr die jeweilige Zellenhäufigkeit vom Modell statistischer Unabhängigkeit abweicht. Pearsons
entspricht der Summe der quadrierten standardisierten Residuen aller Tabellenzellen. Anders ausgedrückt:
ist ein Maß für die Abweichungen der Vorhersagen des Modells statistischer Unabhängigkeit von den empirischen Daten - kurz: ein Maß für die Modellanpassung.
Der Wertebereich von geht von 0 bis
. Der Wert 0 bedeutet, daß
und
statistisch voneinander unabhängig sind. Je größer der statistische Zusammenhang zwischen beiden Variablen ist, desto größer ist auch
.
und alle darauf aufbauenden Assoziationsmaße (z.B. »Cramers
«) sind richtungslose Maßzahlen, die keinen Hinweis auf die Richtung des Zusammenhangs geben. Da Pearsons
der Summe der quadrierten standardisierten Residuen aller Tabellenzellen entspricht, ist seine Maßeinheit aber kaum anschaulich zu interpretieren. Die Interpretation wird zusätzlich dadurch erschwert, daß
eine variable Obergrenze aufweist, die mit dem Stichprobenumfang und der Anzahl der Ausprägungen der beiden Variablen zunimmt.
Man kann daher nicht ohne weiteres sagen, ob ein konkreter
-Wert groß oder klein ist. Zwei Alternativen bieten sich an:
In der Literatur wird häufig als Pearsons Chi-Quadrat oder kurz: als Chi-Quadrat bezeichnet. Das kommt daher, daß in entsprechenden Tests auf statistische Unabhängigkeit in Kreuztabellen die »
-Verteilung« als Prüfverteilung verwendet wird. Wenn man aber
als Chi-Quadrat bezeichnet, eventuell sogar noch mit
(griech.: chi) abkürzt, dann entsteht der (falsche) Eindruck, daß
und die »Zufallsvariable«
, die das Ergebnis eines (hypothetischen) Zufallsexperiments ist und deren Verteilung durch die
-Verteilung beschrieben wird, identisch seien. Es ist jedoch wichtig festzustellen, daß
und
sich erstens nur näherungsweise gleich verhalten und dieses zweitens auch nur unter bestimmten Bedingungen.
ist eigentlich nur eine von Karl Pearson (1857-1936) vorgeschlagene Maßzahl für die Abweichungen zwischen Kontingenz- und Indifferenztabelle, die mit der Zufallsvariablen
erst einmal nichts zu tun hat. Wir bezeichnen sie daher mit Pearsons
.
Notation: .