Beispiele: Wie groß ist die Wahrscheinlichkeit, daß von Personen einer Stichprobe
Personen Frauen sind, wenn der Frauenanteil in der Grundgesamtheit
oder 50% beträgt und die Stichprobe mit Zurücklegen ausgewählt wurde?
Eine Auswahl mit Zurücklegen ist in der empirischen Sozialforschung eigentlich nicht zulässig. Die Bedeutung der Binomialverteilung ergibt sich jedoch daraus, daß die Art der Auswahl bei den in der Sozialforschung üblichen Auswahlsätzen numerisch zu keinen großen Unterschieden führt. Angemessen wäre natürlich eine Auswahl ohne Zurücklegen und dementsprechend die Verwendung der »hypergeometrischen Verteilung«. Ist der Umfang der Stichprobe jedoch relativ zum Umfang
der »Grundgesamtheit« klein (Faustregel:
), unterscheiden sich die nach beiden Verteilungsmodellen berechneten Wahrscheinlichkeiten nur geringfügig. Da die Auswahlsätze
in der empirischen Sozialforschung häufig den Grenzwert von 5% unterschreiten, wird in der Regel die Binomialverteilung vorgezogen, die sich mathematisch einfacher handhaben läßt.
Zusammengefaßt ist die »Wahrscheinlichkeitsfunktion«
der Binomialverteilung von zwei Parametern abhängig: vom Anteil
der Ausprägung
in der »Grundgesamtheit« und vom Umfang
der »Stichprobe«. Die Zufallsvariable
entspricht der Häufigkeit der Ausprägung
in der Stichprobe. Sie kann diskrete Werte
annehmen, ihr Definitionsbereich geht also von 0 bis
.
In vielen Fällen interessiert statt der absoluten die relative Häufigkeit der Ausprägung . Da sich jedoch der »Anteil«
der Ausprägung
problemlos aus der Häufigkeit und dem Stichprobenumfang errechnen läßt (
), geht es dabei nicht um neue Informationen. Wahrscheinlichkeitsfunktion
und alle daraus abgeleiteten Größen (»Erwartungswert«, »Varianz«) können problemlos in entsprechende Funktionen für Anteilswerte umformuliert werden:
,
,
.
Notation:
bezeichnet die Wahrscheinlichkeitsfunktion der Binomialverteilung.