next up previous index
Nächste Seite: Stichprobenverteilungen Aufwärts: Verteilungsmodelle Vorherige Seite: -Verteilung   Index


Freiheitsgrade

Der Begriff der Freiheitsgrade (engl.: degrees of freedom) wird in unterschiedlichen Kontexten benutzt. Dennoch soll der Versuch einer allgemein gültigen Definition unternommen werden: »Zufallsvariablen« setzen sich häufig aus anderen Zufallsvariablen zusammen. Das beste Beispiel sind $ {\frqq}\chi^{2}$-verteilte« Zufallsvariablen, die sich aus einer Summe mehrerer quadrierter Zufallsvariablen ergeben, deren Verteilung wiederum jeweils einer Standardnormalverteilung folgt. Die Größe dieser Summe und damit der Wert von $ \chi^{2}$ hängt von der Anzahl dieser Summanden ab. Es leuchtet daher ein, daß man bei der Analyse der Verteilung der Zufallsvariablen $ \chi^{2}$ die Anzahl der Summanden kontrollieren muß. Anders ausgedrückt: Der Wertebereich, der $ \dq$Freiraum$ \dq$, in dem sich diese Größe bewegen kann, ist eine Funktion der Anzahl der Summanden, die daher Freiheitsgrade genannt werden.

Die Bedeutung der Freiheitsgrade erschließt sich aber vor allem in der statistischen Anwendung, z.B. bei der Durchführung von »Hypothesentests«. Zur Entscheidung eines Hypothesentests verwendet man je nach Anwendung bestimmte »Prüfgrößen«, deren Verteilung näherungsweise oder exakt durch ein theoretisches Verteilungsmodell beschrieben werden kann. Auf diese Weise lassen sich überzufällig große (signifikante) von anderen Werten der Prüfgröße unterscheiden.

Beispiele: Der Chi-Quadrat-Unabhängigkeitstest verwendet als Prüfgröße Pearsons $ X^{2}$, das näherungsweise $ \chi^{2}$-verteilt ist. Der $ F$-Test verwendet als Prüfgröße den Quotienten aus Zwischen- und Binnenvariation, der $ F$-verteilt ist.

Anders ausgedrückt: Die verwendeten Prüfgrößen, die auf empirischen Daten beruhen, verhalten sich so ähnlich wie bestimmte Zufallsvariablen und sind zum Teil auch so ähnlich mathematisch aufgebaut. »Pearsons $ X^{2}$« entspricht beispielsweise auch einer Summe quadrierter Größen. Bei der Berechnung muß aber berücksichtigt werden, ob die Einzelergebnisse, die in die Prüfgröße eingehen, tatsächlich voneinander unabhängig sind.

Beispiele: Zur Berechnung von Pearsons $ X^{2}$ werden die erwarteten Häufigkeiten unter der Annahme der Unabhängigkeit benötigt. Sie werden aus den Randhäufigkeiten der Kreuztabelle berechnet. Anders ausgedrückt: Es können nicht beliebige erwartete Häufigkeiten verwendet werden, sondern nur solche Häufigkeiten, die in der Summe wieder die Randhäufigkeiten der Tabelle ergeben. Die verwendeten Rechenformeln für die erwarteten Häufigkeiten stellen das automatisch sicher, faktisch besteht aber Pearsons $ X^{2}$ nicht mehr aus genauso vielen Summanden wie Zellen in der $ r\times c$-Tabelle existieren, sondern aus $ (r-1) \cdot (c-1)$. Bei vielen anderen Prüfgrößen spielt u.a. die Varianz eine Rolle. Sie entspricht der Summe der quadrierten Abweichungen ($ SAQ$) vom arithmetischen Mittel. Bei $ n$ Untersuchungseinheiten sind das im Prinzip $ n$ Summanden. Die Verwendung des arithmetischen Mittels hat jedoch zur Folge, daß die Summe der einfachen (nicht quadrierten) Abweichungen gleich 0 ist. Das heißt: Eine der n Abweichungen läßt sich aus allen anderen errechnen. Analoges gilt für die quadrierten Abweichungen. Folglich besteht $ SAQ$ nicht aus $ n$ voneinander unabhängigen Summanden, sondern lediglich aus $ (n-1)$.

In allen Beispielen spricht man von einem Verlust von Freiheitsgraden, um deutlich zu machen, daß der jeweiligen Prüfgröße weniger unabhängige Informationen zugrundeliegen als Daten zur Verfügung stehen. Daraus ergibt sich eine ganz allgemeine Berechnungsformel für Freiheitsgrade, die auch in den verschiedensten multivariaten Analyseverfahren anwendbar ist: Die Anzahl der Freiheitsgrade entspricht der Anzahl der Daten abzüglich der Anzahl der geschätzten Parameter des jeweiligen Modells.

Beispiele: Diese Formel ist auch auf die beiden Beispiele (Pearsons $ X^{2}$, Varianz) übertragbar. In einer $ 2\times 2$-Tabelle liegen insgesamt 4 Häufigkeiten (Daten) vor. Die erwarteten Häufigkeiten ergeben sich aus einem Regressionsmodell mit 3 Parametern, die (i) die durchschnittliche Größe der Häufigkeiten, (ii) die Randverteilung der Variablen X und (iii) die Randverteilung der Variablen Y kontrollieren. Dieses Modell hat daher $ 4-3=1$ Freiheitsgrad. Diese Art der Berechnung liefert das gleiche Ergebnis wie die Formel $ df = (r-1)\cdot (c-1) = (2-1)\cdot (2-1) = 1$. Zur Berechnung der Varianz liegen Werte für insgesamt $ n$ Untersuchungseinheiten vor. Für die Berechnung der Abweichungen ist ein Parameter notwendig, das arithmetische Mittel. Folglich liegen der Berechnung der Varianz $ (n-1)$ Freiheitsgrade zugrunde.

Notation: $ df$ (engl.: degrees of freedom).


next up previous index
Nächste Seite: Stichprobenverteilungen Aufwärts: Verteilungsmodelle Vorherige Seite: -Verteilung   Index
HJA 2001-10-01