next up previous index
Nächste Seite: Korrelationskoeffizient Aufwärts: Regression und Korrelation Vorherige Seite: Determinationskoeffizient   Index


Kovarianz und Kovariation

Die Kovarianz (engl.: covariance) ist ein »Assoziationsmaß« für zwei »kontinuierliche Variablen« $ X$ und $ Y$. Wenn ein positiver Zusammenhang vorliegt, dann sollten »Untersuchungseinheiten« mit überdurchschnittlichen (unterdurchschnittlichen) Werten bei $ X$ auch bei $ Y$ überdurchschnittliche (unterdurchschnittliche) Werte aufweisen. Liegt dagegen ein negativer Zusammenhang von, dann sollten überdurchschnittliche Werte von $ X$ zusammen mit unterdurchschnittlichen Werten von $ Y$ und umgekehrt auftreten. Um diese Kombination über- und unterdurchschnittlicher Werte zweier Variablen $ X$ und $ Y$ zu messen, betrachtet man für jede Untersuchungseinheit das Produkt der Abweichungen ihrer $ x$- und $ y$-Werte vom jeweiligen »arithmetischen Mittel« der Variablen $ X$ und $ Y$. Die Summe dieser Produkte bezeichnet man als Kovariation. Sie wird um so größer, je mehr Untersuchungseinheiten betrachtet werden. Diesen Effekt kann man kontrollieren, indem man die Kovariation durch die Anzahl der Untersuchungseinheiten dividiert. Auf diese Weise ergibt sich die Kovarianz, die so etwas wie eine $ \dq$durchschnittliche$ \dq$ Kovariation darstellt. Handelt es sich allerdings um eine »Stichprobe«, mit der man die Kovarianz in der »Grundgesamtheit« schätzen möchte, dann sollte man nicht durch den Stichprobenumfang $ n$, sondern durch $ n-1$ dividieren, weil sich dann ein unverzerrter Schätzwert ergibt (ein Schätzwert, der im Mittel mit der tatsächlichen Kovarianz der Grundgesamtheit übereinstimmt).

Notation: $ s_{xy}$ in der Stichprobe, $ \sigma _{xy}$ in der Grundgesamtheit.


next up previous index
Nächste Seite: Korrelationskoeffizient Aufwärts: Regression und Korrelation Vorherige Seite: Determinationskoeffizient   Index
HJA 2001-10-01