next up previous index
Nächste Seite: Standardabweichung Aufwärts: Streuung Vorherige Seite: Streuung   Index


Varianz und Variation

Die Varianz ist ein Maß für die Streuung einer »Variablen« $ X$ (engl.: variance). Sie basiert auf der Summe der quadrierten Abweichungen jedes Variablenwertes vom »arithmetischen Mittel« über alle »Untersuchungseinheiten«. Damit man diese Abweichungen berechnen kann, muß es sich um eine metrische Variable handeln (vgl. »Meßniveau«). Die Summe der quadrierten Abweichungen bezeichnet man auch als Variation. Sie wird um so größer, je mehr Untersuchungseinheiten betrachtet werden. Diesen Effekt kann man kontrollieren, indem man die Variation durch die Anzahl der Untersuchungseinheiten dividiert. Auf diese Weise ergibt sich die Varianz, die so etwas wie eine $ \dq$durchschnittliche$ \dq$ quadrierte Abweichung darstellt. Handelt es sich allerdings um eine »Stichprobe«, mit der man die Varianz in der »Grundgesamtheit« schätzen möchte, dann sollte man nicht durch den »Stichprobenumfang« $ n$, sondern durch $ n-1$ dividieren, weil sich dann ein unverzerrter Schätzwert ergibt (ein Schätzwert, der im Mittel mit der tatsächlichen Varianz der Grundgesamtheit übereinstimmt).

Ähnlich wie das arithmetische Mittel wird auch die Varianz von extremen Datenwerten negativ beeinflußt. Da diese mit dem Quadrat ihrer Abweichung vom arithmetischen Mittel in die Berechnung eingehen, kann die Varianz durch einzelne, vom arithmetischen Mittel weit abweichende Werte sehr groß werden.

Notation: $ s^{2}$ in der Stichprobe, $ \sigma ^{2}$ (griech.: sigma) in der Grundgesamtheit.


next up previous index
Nächste Seite: Standardabweichung Aufwärts: Streuung Vorherige Seite: Streuung   Index
HJA 2001-10-01