next up previous index
Nächste Seite: Normalverteilung Aufwärts: Verteilungsmodelle Vorherige Seite: Hypergeometrische Verteilung   Index


Binomialverteilung

Die Binomialverteilung (engl.: binomial distribution) ist ein Verteilungsmodell für »diskrete Zufallsvariablen«, genauer gesagt: für Zufallsvariablen mit zwei Ausprägungen (im folgenden $ a$ und $ b$ genannt). Hat eine Zufallsvariable mehr als zwei Ausprägungen, muß sie erst geeignet dichotomisiert werden. Konkret geht es bei der Binomialverteilung um die Frage, mit welcher Wahrscheinlichkeit die Ausprägung $ a$ in einer »Stichprobe« $ x$ mal vorkommt, wenn diese Stichprobe mit Zurücklegen ausgewählt wurde (vgl. »Auswahltechnik«).

Beispiele: Wie groß ist die Wahrscheinlichkeit, daß von $ n=10$ Personen einer Stichprobe $ X=3$ Personen Frauen sind, wenn der Frauenanteil in der Grundgesamtheit $ \theta=0.5$ oder 50% beträgt und die Stichprobe mit Zurücklegen ausgewählt wurde?

Eine Auswahl mit Zurücklegen ist in der empirischen Sozialforschung eigentlich nicht zulässig. Die Bedeutung der Binomialverteilung ergibt sich jedoch daraus, daß die Art der Auswahl bei den in der Sozialforschung üblichen Auswahlsätzen numerisch zu keinen großen Unterschieden führt. Angemessen wäre natürlich eine Auswahl ohne Zurücklegen und dementsprechend die Verwendung der »hypergeometrischen Verteilung«. Ist der Umfang $ n$ der Stichprobe jedoch relativ zum Umfang $ N$ der »Grundgesamtheit« klein (Faustregel: $ n/N<0,05$), unterscheiden sich die nach beiden Verteilungsmodellen berechneten Wahrscheinlichkeiten nur geringfügig. Da die Auswahlsätze $ n/N$ in der empirischen Sozialforschung häufig den Grenzwert von 5% unterschreiten, wird in der Regel die Binomialverteilung vorgezogen, die sich mathematisch einfacher handhaben läßt.

Zusammengefaßt ist die »Wahrscheinlichkeitsfunktion« $ f_{B}(x\vert n,\theta)$ der Binomialverteilung von zwei Parametern abhängig: vom Anteil $ \theta$ der Ausprägung $ a$ in der »Grundgesamtheit« und vom Umfang $ n$ der »Stichprobe«. Die Zufallsvariable $ X$ entspricht der Häufigkeit der Ausprägung $ a$ in der Stichprobe. Sie kann diskrete Werte $ 0, 1, \ldots, n$ annehmen, ihr Definitionsbereich geht also von 0 bis $ n$.

In vielen Fällen interessiert statt der absoluten die relative Häufigkeit der Ausprägung $ a$. Da sich jedoch der »Anteil« $ p$ der Ausprägung $ a$ problemlos aus der Häufigkeit und dem Stichprobenumfang errechnen läßt ($ p=x/n$), geht es dabei nicht um neue Informationen. Wahrscheinlichkeitsfunktion $ f_{B}(x\vert n,\theta)$ und alle daraus abgeleiteten Größen (»Erwartungswert«, »Varianz«) können problemlos in entsprechende Funktionen für Anteilswerte umformuliert werden: $ f_{B}(p\vert n,\theta)$, $ E(p)$, $ Var(p)$.

Notation: $ f_{B}(x\vert n,\theta)$ bezeichnet die Wahrscheinlichkeitsfunktion der Binomialverteilung.


next up previous index
Nächste Seite: Normalverteilung Aufwärts: Verteilungsmodelle Vorherige Seite: Hypergeometrische Verteilung   Index
HJA 2001-10-01