next up previous index
Nächste Seite: Mutungsintervall Aufwärts: Stichprobenverteilungen Vorherige Seite: Anzahl möglicher Zufallsstichproben   Index


Stichprobenfehler und Stichprobenverteilung

Wenn man zufällig $ n$ Personen aus der Bevölkerung auswählt und deren Durchschnittsalter bestimmt, dann ist nicht sichergestellt, daß dieser Wert dem Durchschnittsalter der Bevölkerung insgesamt entspricht. Das »arithmetische Mittel« kann in dieser (und den anderen möglichen) »Zufallsstichproben« vom Durchschnittswert der Grundgesamtheit zufällig abweichen. Diese Abweichungen vom Grundgesamtheitsparameter bezeichnet man als Stichprobenfehler (engl.: sampling error). Wenn man alle möglichen Zufallsstichproben vom Umfang $ n$ betrachtet und jeweils das arithmetische Mittel notiert, erhält man einen Überblick über die Verteilung des arithmetischen Mittels, die man auch graphisch darstellen kann. Diese Darstellung vermittelt einen Eindruck davon, wie sehr das arithmetische Mittel in Stichproben schwanken kann, wie groß also der Stichprobenfehler ist. Die Streuung der arithmetischen Mittel über die verschiedenen Stichproben mißt man mit dem »Standardfehler«. Ähnlich könnte man bei anderen Stichprobenstatistiken vorgehen: z.B. bei der Standardabweichung oder beim Median. Auch hier sind Abweichungen des Wertes in der Stichprobe von dem entsprechenden Wert in der Grundgesamtheit erwartbar. Die Verteilung einer Stichprobenstatistik über alle möglichen Stichproben bezeichnet man als Stichprobenverteilung (engl.: sampling distribution).[*]

Ist die Verteilung eines Merkmals in der Grundgesamtheit bekannt, dann kann man sich anhand einer geeigneten Stichprobenverteilung überlegen, wie sich bestimmte Statistiken dieses Merkmals in Stichproben mit gegebenem Umfang $ n$ verteilen. Diesen Schluß von einer bekannten Grundgesamtheit auf eine Stichprobe bezeichnet man auch als Inklusionsschluß (direkter Schluß). Man kann allerdings keine sicheren Prognosen machen, sondern nur Aussagen, deren Eintreffen mit einer bestimmten Wahrscheinlichkeit erwartet wird. Man benennt daher ein sogenanntes »Mutungsintervall«, in dem die Stichprobenstatistik mit einer bestimmten Wahrscheinlichkeit erwartet wird.

Um das Mutungsintervall berechnen zu können, müssen alle Parameter des Merkmals in der Grundgesamtheit bekannt sein: bei kontinuierlichen Variablen zentrale Lage und Streuung, bei kategorialen Variablen der Anteil einzelner Ausprägungen. Die Verteilungsform (nur wichtig bei kontinuierlichen Merkmalen) kann bei hinreichend großen Stichproben (Faustregel: $ n>30$) unter Rekurs auf den zentralen Grenzwertsatz ignoriert werden. Schließlich benötigt man noch Angaben über den »Standardfehler« der Stichprobenstatistik. Welches Verteilungsmodell konkret die Verteilung der Stichprobenstatistik beschreibt, hängt von der jeweiligen Anwendung ab. Für Häufigkeiten oder Anteilswerte kategorialer Variablen ist je nach »Auswahltechnik« entweder die »Binomial-« oder die »hypergeometrische Verteilung« die geeignete Stichprobenverteilung. Für das arithmetisches Mittel kontinuierlicher Variablen wird die »Normalverteilung« als Stichprobenverteilung verwendet. Bei sehr kleinen Stichproben ($ n \leq 30$) ist das aber nur eine Näherung. Außerdem ist bei Auswahlsätzen über 5% ein Korrekturfaktor für endliche Gesamtheiten notwendig (vgl. »Auswahltechnik«).


next up previous index
Nächste Seite: Mutungsintervall Aufwärts: Stichprobenverteilungen Vorherige Seite: Anzahl möglicher Zufallsstichproben   Index
HJA 2001-10-01