next up previous index
Nächste Seite: -Verteilung Aufwärts: Verteilungsmodelle Vorherige Seite: Normalverteilung   Index

$ \chi^{2}$-Verteilung

Die $ \chi^{2}$-Verteilung (engl.: chi-square distribution) ist ein Verteilungsmodell für eine »kontinuierliche Zufallsvariable«. Dieses Verteilungsmodell ist dann von Bedeutung, wenn man eine Summe quadrierter Zufallsvariablen betrachtet, deren Verteilung jeweils einer »Standardnormalverteilung« folgt. Diese Problemstellung taucht häufig bei statistischen Tests auf, z.B. beim sogenannten »Chi-Quadrat-Unabhängigkeitstest«.

Beispiele: In einer $ 3 \times 4$-Tabelle wird der statistische Zusammenhang zweier kategorialer Variablen $ X$ und $ Y$ gemessen. Pearson $ X^{2}$ betrage $ 5,76$. Da keine der erwarteten Häufigkeiten kleiner als $ 5$ ist, ist Pearson $ X^{2}$ näherungsweise $ \chi^{2}$-verteilt. Bei dem Unabhängigkeitstest geht es um die Frage, wie groß die Wahrscheinlichkeit ist, daß bei $ 6$ Freiheitsgraden in der Tabelle ein $ X^{2}$-Wert von $ 5,76$ oder größer auftreten kann.

Die $ \chi^{2}$-Verteilung wurde von Karl Pearson (1857-1936) entwickelt. Ihre Herleitung muß notwendigerweise abstrakt bleiben: Sind $ Z_{1}, Z_{2}, \ldots, Z_{df}$ voneinander unabhängige standardnormalverteilte Zufallsvariablen, dann besitzt die Quadratsumme $ X^{2} = Z_{1}^{2} + Z_{2}^{2} + \ldots + Z_{df}^{2}$ eine $ \chi^{2}$-Verteilung mit $ df$ Freiheitsgraden. Da es sich um eine Summe quadrierter Größen handelt, kann $ X^{2}$ keine negativen Werte annehmen, und folglich ist die $ \chi^{2}$-Verteilung ein Verteilungsmodell für positive kontinuierliche Zufallsvariablen: $ 0 \leq \chi^{2} \leq +\infty$.

Zusammengefaßt ist die »Dichtefunktion« $ f_{Ch}(\chi^{2}\vert df)$ der $ \chi^{2}$-Verteilung nur von einem Parameter abhängig: von der Anzahl der »Freiheitsgrade« $ df$ (engl.: degrees of freedom). Der Graph der Dichtefunktion ähnelt dem Profil eines Sandhaufens, den der Wind vor einer Mauer (der $ y$-Achse) aufgetürmt hat. Je größer die Anzahl der Freiheitsgrade, desto mehr verschiebt sich der Gipfel des Sandhaufens nach rechts. Bei $ df \geq 30$ nähert sich die $ \chi^{2}$-Verteilung einer im positiven Wertebereich aufgesetzten Normalverteilung.

Für statistische Tests ist eine »Tabelle« der inversen »Verteilungsfunktion« der $ \chi^{2}$-Verteilung notwendig. $ \chi^{2}(1-\alpha \vert df)$ zeigt für ausgewählte Wahrscheinlichkeiten $ 1-\alpha $ und Freiheitsgrade $ df$ die entsprechenden Quantile der $ \chi^{2}$-Verteilung.

Beispiele: Man möchte wissen, in welchem Bereich die unteren 95% aller $ \chi^{2}$-Werte bei 2 Freiheitsgraden liegen. Aus der Tabelle entnimmt man für $ 1-\alpha =0,95$ das 95%-Quantil 5,99. Die unteren 95% aller $ \chi^{2}$-Werte liegen bei 2 Freiheitsgraden also im Bereich von 0 bis einschließlich 5,99. Anders ausgedrückt: 5% aller $ \chi^{2}$-Werte sind bei 2 Freiheitsgraden größer als 5,99.

Notation: $ f_{Ch}(\chi^{2}\vert df)$ bezeichnet die Dichtefunktion der $ \chi^{2}$-Verteilung, $ \chi^{2}(1-\alpha \vert df)$ die entsprechende inverse Verteilungsfunktion.


next up previous index
Nächste Seite: -Verteilung Aufwärts: Verteilungsmodelle Vorherige Seite: Normalverteilung   Index
HJA 2001-10-01