Die Bedeutung der Freiheitsgrade erschließt sich aber vor allem in der statistischen Anwendung, z.B. bei der Durchführung von »Hypothesentests«. Zur Entscheidung eines Hypothesentests verwendet man je nach Anwendung bestimmte »Prüfgrößen«, deren Verteilung näherungsweise oder exakt durch ein theoretisches Verteilungsmodell beschrieben werden kann. Auf diese Weise lassen sich überzufällig große (signifikante) von anderen Werten der Prüfgröße unterscheiden.
Beispiele: Der Chi-Quadrat-Unabhängigkeitstest verwendet als Prüfgröße Pearsons , das näherungsweise
-verteilt ist. Der
-Test verwendet als Prüfgröße den Quotienten aus Zwischen- und Binnenvariation, der
-verteilt ist.
Anders ausgedrückt: Die verwendeten Prüfgrößen, die auf empirischen Daten beruhen, verhalten sich so ähnlich wie bestimmte Zufallsvariablen und sind zum Teil auch so ähnlich mathematisch aufgebaut. »Pearsons « entspricht beispielsweise auch einer Summe quadrierter Größen. Bei der Berechnung muß aber berücksichtigt werden, ob die Einzelergebnisse, die in die Prüfgröße eingehen, tatsächlich voneinander unabhängig sind.
Beispiele: Zur Berechnung von Pearsons werden die erwarteten Häufigkeiten unter der Annahme der Unabhängigkeit benötigt. Sie werden aus den Randhäufigkeiten der Kreuztabelle berechnet. Anders ausgedrückt: Es können nicht beliebige erwartete Häufigkeiten verwendet werden, sondern nur solche Häufigkeiten, die in der Summe wieder die Randhäufigkeiten der Tabelle ergeben. Die verwendeten Rechenformeln für die erwarteten Häufigkeiten stellen das automatisch sicher, faktisch besteht aber Pearsons
nicht mehr aus genauso vielen Summanden wie Zellen in der
-Tabelle existieren, sondern aus
. Bei vielen anderen Prüfgrößen spielt u.a. die Varianz eine Rolle. Sie entspricht der Summe der quadrierten Abweichungen (
) vom arithmetischen Mittel. Bei
Untersuchungseinheiten sind das im Prinzip
Summanden. Die Verwendung des arithmetischen Mittels hat jedoch zur Folge, daß die Summe der einfachen (nicht quadrierten) Abweichungen gleich 0 ist. Das heißt: Eine der n Abweichungen läßt sich aus allen anderen errechnen. Analoges gilt für die quadrierten Abweichungen. Folglich besteht
nicht aus
voneinander unabhängigen Summanden, sondern lediglich aus
.
In allen Beispielen spricht man von einem Verlust von Freiheitsgraden, um deutlich zu machen, daß der jeweiligen Prüfgröße weniger unabhängige Informationen zugrundeliegen als Daten zur Verfügung stehen. Daraus ergibt sich eine ganz allgemeine Berechnungsformel für Freiheitsgrade, die auch in den verschiedensten multivariaten Analyseverfahren anwendbar ist: Die Anzahl der Freiheitsgrade entspricht der Anzahl der Daten abzüglich der Anzahl der geschätzten Parameter des jeweiligen Modells.
Beispiele: Diese Formel ist auch auf die beiden Beispiele (Pearsons , Varianz) übertragbar. In einer
-Tabelle liegen insgesamt 4 Häufigkeiten (Daten) vor. Die erwarteten Häufigkeiten ergeben sich aus einem Regressionsmodell mit 3 Parametern, die (i) die durchschnittliche Größe der Häufigkeiten, (ii) die Randverteilung der Variablen X und (iii) die Randverteilung der Variablen Y kontrollieren. Dieses Modell hat daher
Freiheitsgrad. Diese Art der Berechnung liefert das gleiche Ergebnis wie die Formel
. Zur Berechnung der Varianz liegen Werte für insgesamt
Untersuchungseinheiten vor. Für die Berechnung der Abweichungen ist ein Parameter notwendig, das arithmetische Mittel. Folglich liegen der Berechnung der Varianz
Freiheitsgrade zugrunde.
Notation: (engl.: degrees of freedom).