next up previous index
Nächste Seite: -Verteilung Aufwärts: Verteilungsmodelle Vorherige Seite: -Verteilung   Index

$ T$-Verteilung

Die $ \emph{T}$-Verteilung (engl.: Student's $ T$ distribution) ist ein Verteilungsmodell für eine »kontinuierliche Zufallsvariable«. Sie wurde von William S. Gosset (1876-1937) entwickelt, der unter dem Pseudonym Student publizierte. Daher auch der Name Student-Verteilung. Sie sieht der »Normalverteilung« täuschend ähnlich und wird immer dann benötigt, wenn Zufallsvariablen betrachtet werden, die aus der Division einer »normal-« und einer »$ \chi^{2}$-verteilten« Zufallsvariablen entstehen. Diese Problemstellung tritt z.B. dann auf, wenn man Abweichungen einer kontinuierlichen Variablen von ihrem Erwartungswert betrachtet und diese Abweichungen in Einheiten der Standardabweichung dieser Variablen mißt. Typische Beispiele sind Konfidenzintervalle und statistische Tests für arithmetische Mittelwerte und Mittelwertdifferenzen.

Beispiele: Bei einer experimentellen Untersuchung eines neuen Lehrprogramms unterscheiden sich die Testleistungen der Experimental- und Kontrollgruppe um 3,4 Testpunkte. Diese Mittelwertdifferenz ist ein Schätzwert für den Lernzuwachs, den man mit dem neuen Lehrprogramm erzielen kann. Verglichen mit der Vermutung, das Lernprogramm erbringe überhaupt keinen Lernzuwachs, ist eine Zunahme um 3,4 Testpunkte nicht unerheblich, sie könnte aber auch zufällig zustande gekommen sein. Die Daten der Untersuchung zeigen weiterhin, daß solche Schätzwerte unter den gegebenen Bedingungen (14 Personen in der Experimental-, 13 in der Kontrollgruppe) mit einer Standardabweichung von $ s=1,7$ Testpunkten streuen können. Diese Standardabweichung möglicher Schätzwerte, der sogenannte Standardfehler, wurde ebenfalls mit Hilfe der Daten geschätzt. Mit Hilfe der $ T$-Verteilung kann man nun die Frage beantworten, ob es eher wahrscheinlich oder eher unwahrscheinlich ist, eine so große Testpunktdifferenz festzustellen, wenn das Lernprogramm in Wahrheit gar keinen Lernzuwachs zur Folge hat. Die Prüfgröße ist die Abweichung der beobachteten Differenz von der eigentlichen Erwartung in Einheiten der Standardabweichung: $ t=(3,4 - 0) / 1,7 = 2$. Die Frage lautet: Wie wahrscheinlich ist bei 25 $ (=14+13-2)$ Freiheitsgraden ein t-Wert, der größer oder gleich $ 2$ ist.

Formal liegt der $ T$-Verteilung folgendes stochastisches Modell zugrunde: $ Z$ und $ U$ seien zwei voneinander unabhängige Zufallsvariablen. $ Z$ folge einer Standardnormalverteilung und $ U$ einer $ \chi^{2}$-Verteilung mit $ df$ Freiheitsgraden. Dann hat die Zufallsvariable $ T=Z/\sqrt {U/df}$ eine $ T$-Verteilung. Der Definitionsbereich von $ T$ ist im Prinzip unbegrenzt: $ -\infty \leq t \leq +\infty$.

Zusammengefaßt ist die »Dichtefunktion« $ f_{S}(t\vert df)$ der $ T$-Verteilung nur von einem Parameter abhängig: von der Anzahl der »Freiheitsgrade« $ df$ (engl.: degrees of freedom). Der Graph der Dichtefunktion sieht ähnlich aus wie die Standardnormalverteilung, je geringer die Anzahl der Freiheitsgrade, um so breiter ist jedoch die $ T$-Verteilung. Bei wenigen Freiheitsgraden ergeben sich daher größere charakteristische Wertebereiche als bei Zugrundelegung der Normalverteilung.

Beispiele: Während 90% (95%, 99%) aller Werte einer normalverteilten Zufallsvariablen innerhalb von 1,645 (1,960, 2,576) Standardabweichungen rechts und links des Erwartungswertes zu finden sind, liegen die gleichen Anteile bei einer $ T$-verteilten Zufallsvariablen mit 3 Freiheitsgraden innerhalb von 2,353 (3,182, 5,841) Standardabweichungen rechts und links des Erwartungswertes.

Mit zunehmender Anzahl von Freiheitsgraden nähert sich die $ T$-Verteilung immer mehr der Standardnormalverteilung an. Als Faustregel gilt: Bei 30 und mehr Freiheitsgraden kann man näherungsweise die Standardnormalverteilung verwenden.

Für statistische Tests ist eine »Tabelle« der inversen »Verteilungsfunktion« der $ T$-Verteilung notwendig. $ T(1-\alpha \vert df)$ zeigt für ausgewählte Wahrscheinlichkeiten $ 1-\alpha $ und Freiheitsgrade $ df$ die entsprechenden Quantile der $ T$-Verteilung.

Beispiele: Man möchte wissen, in welchem Bereich die unteren 95% aller $ t$-Werte bei 2 Freiheitsgraden liegen. Aus der Tabelle entnimmt man für $ 1-\alpha =0,95$ das 95%-Quantil 2,920. Die unteren 95% aller $ t$-Werte liegen bei 2 Freiheitsgraden also im Bereich von $ -\infty$ bis einschließlich 2,920. Anders ausgedrückt: 5% aller $ t$-Werte sind bei 2 Freiheitsgraden größer als 2,920.

Notation: $ f_{S}(t\vert df)$ bezeichnet die Dichtefunktion der $ T$-Verteilung, $ T(1-\alpha \vert df)$ die entsprechende inverse Verteilungsfunktion.


next up previous index
Nächste Seite: -Verteilung Aufwärts: Verteilungsmodelle Vorherige Seite: -Verteilung   Index
HJA 2001-10-01