next up previous index
Nächste Seite: Freiheitsgrade Aufwärts: Verteilungsmodelle Vorherige Seite: -Verteilung   Index

$ F$-Verteilung

Die $ F$-Verteilung (engl.: $ F$ distribution) ist ein Verteilungsmodell für eine »kontinuierliche Zufallsvariable«. Sie wurde von Sir Ronald A. Fisher (1890-1962) entwickelt und heißt daher auch Fisher-Verteilung. Dieses Verteilungsmodell ist dann von Bedeutung, wenn man den Quotienten zweier »$ \chi^{2}$-verteilter« Zufallsvariablen betrachtet, z.B. dann, wenn man die Unterschiede zweier Varianzen testet.

Beispiele: Im Rahmen der Varianzanalyse wird die Variation der Zielvariablen zwischen den Gruppen ($ SAQZ$) in Relation zur Variation innerhalb der Gruppen ($ SAQI$) betrachtet. Mit Hilfe der $ F$-Verteilung läßt sich entscheiden, ob $ SAQZ$ signifikant größer als $ SAQI$ ist. Dazu betrachtet man den Quotienten der $ \dq$durchschnittlichen$ \dq$ Variation zwischen und innerhalb der Gruppen. $ \dq$Durchschnittlich$ \dq$ meint in diesem Fall, daß die jeweilige Variation durch die Anzahl der Freiheitsgrade dividiert wird. Untersucht man beispielsweise $ 3$ Gruppen mit insgesamt $ 453$ Untersuchungspersonen, dann ergeben sich $ 3-1=2$ Freiheitsgrade für die Zwischenvariation und $ 453-3=450$ Freiheitsgrade für die Binnenvariation. Die Prüfgröße $ f=(SAQZ/2) / (SAQI/450)$ ist $ F$-verteilt mit $ df_{1}=2$ und $ df_{2}=45$0 Freiheitsgraden, und man kann aus entsprechenden Tabellenwerken ablesen, wie wahrscheinlich es ist, daß die Prüfgröße einen bestimmten Wert überschreitet. Beträgt die Variation zwischen den Gruppen z.B. $ SAQZ=100$ und die innerhalb der Gruppen $ SAQI=900$, dann ergibt sich ein Wert von $ f=(100/2) / (900/450) = 50 / 2 = 25$. Hierbei handelt es sich um einen relativ großen Wert, denn aus der Verteilungsfunktion der $ F$-Verteilung ergibt sich, daß bei $ df_{1}=2$ und $ df_{2}=45$0 Freiheitsgraden nur 13,7% aller $ f$-Werte größer sind.

Formal liegt der $ F$-Verteilung folgendes stochastisches Modell zugrunde: Seien $ U_{1}$ und $ U_{2}$ zwei voneinander unabhängige Zufallsvariablen, die jeweils einer $ \chi^{2}$-Verteilung mit $ df_{1}$ bzw. $ df_{2}$ Freiheitsgraden folgen, dann hat die Zufallsvariable $ F=(U_{1}/df_{1})/(U_{2}/df_{2})$ eine $ F$-Verteilung. Weil hier zwei Zufallsvariablen dividiert werden, die nur positive Werte annehmen, ist der Definitionsbereich der Zufallsvariablen $ F$ ebenfalls auf den positiven Bereich beschränkt: $ 0 \leq f \leq +\infty$.

Zusammengefaßt ist die »Dichtefunktion« $ f_{F}(f\vert df_{1},df_{2})$ der $ F$-Verteilung von zwei Parametern abhängig: von den Zählerfreiheitsgraden $ df_{1}$ und den Nennerfreiheitsgraden $ df_{2}$ (engl.: degrees of freedom). Der Graph der Dichtefunktion ähnelt dem Graphen der $ \chi^{2}$-Verteilung.

Für statistische Tests ist eine »Tabelle« der inversen »Verteilungsfunktion« der $ F$-Verteilung notwendig. $ F(1-\alpha \vert df_{1}, df_{2})$ zeigt für ausgewählte Wahrscheinlichkeiten $ 1-\alpha $ und Freiheitsgrade $ df_{1}$ bzw. $ df_{2}$ die entsprechenden Quantile der $ F$-Verteilung.

Beispiele: Man möchte wissen, in welchem Bereich die unteren 95% aller $ f$-Werte bei $ df_{1}=2$ und $ df_{2}=3$ Freiheitsgraden liegen. Aus der Tabelle entnimmt man für $ 1-\alpha =0,95$ das 95%-Quantil 9,55. Die unteren 95% aller $ f$-Werte liegen bei $ df_{1}=2$ und $ df_{2}=3$ Freiheitsgraden also im Bereich von 0 bis einschließlich 9,55. Anders ausgedrückt: 5% aller $ f$-Werte sind bei $ df_{1}=2$ und $ df_{2}=3$ Freiheitsgraden größer als 9,55.

Notation: $ f_{F}(f\vert df_{1},df_{2})$ bezeichnet die Dichtefunktion der $ F$-Verteilung, $ F(1-\alpha \vert df_{1}, df_{2})$ die entsprechende inverse Verteilungsfunktion.


next up previous index
Nächste Seite: Freiheitsgrade Aufwärts: Verteilungsmodelle Vorherige Seite: -Verteilung   Index
HJA 2001-10-01