next up previous index
Nächste Seite: Varianzanalyse Aufwärts: Regression und Korrelation Vorherige Seite: Kovarianz und Kovariation   Index

Korrelationskoeffizient $ r$

Der Korrelationskoeffizient $ r$ (engl.: correlation coefficient), der auf Bravais zurückgeht und von Pearson weiterentwickelt wurde, ist ein »Assoziationsmaß« für »kontinuierliche Variablen«. Da es verschiedene Arten von Korrelationskoeffizienten gibt (punktbiseriale, biseriale, polyseriale, tetrachorische), wird er zur Abgrenzung auch manchmal als Produkt-Moment-Korrelationskoeffizient bezeichnet. Im Gegensatz zur »Regressionsanalyse«, in der es eine klare Trennung zwischen abhängiger und unabhängiger Variablen gibt (»asymmetrische Fragestellung«), betrachtet der Korrelationskoeffizient beide Variablen gleichberechtigt (»symmetrische Fragestellung«). Es geht um Kovariation von $ X$ und $ Y$ und nicht um Vorhersage von $ Y$ durch $ X$. Darüber hinaus werden beide Variablen, die eventuell in unterschiedlichen Maßeinheiten gemessen wurden, durch eine »z-Transformation« standardisiert und vergleichbar gemacht. Der Korrelationskoeffizient $ r$ ist eine mit den jeweiligen Standardabweichungen standardisierte »Kovarianz« zweier Variablen $ X$ und $ Y$.

Der Wertebereich des Korrelationskoeffizienten geht von $ -1$ bis $ +1$, wobei $ r=0$ darauf hinweist, daß kein Zusammenhang zwischen beiden Variablen existiert. $ r=-1$ weist auf einen perfekten negativen und $ r=+1$ auf einen perfekten positiven Zusammenhang hin. Dabei sollte man beachten, daß der Korrelationskoeffizient nur lineare Zusammenhänge mißt. Stehen beide Variablen in einem nicht-linearen Zusammenhang, ist es gut möglich, daß der Korrelationskoeffizient gleich 0 ist.

Bei der Interpretation kann man sich auf diese Fixpunkte des Wertebereichs beziehen und sagen, daß sich der jeweilige Wert des Korrelationskoeffizienten entweder in der Nähe von 0 (kein Zusammenhang), im mittleren Wertebereich oder in der Nähe von $ -1$ oder $ +1$ (perfekter Zusammenhang) bewegt. Von besonderem Interesse ist bei kontinuierlichen Variablen auch die Richtung des Zusammenhangs (das Vorzeichen von $ r$).

Zwischen dem Korrelationskoeffizienten $ r$ und dem bivariaten Regressionsmodell bestehen gewisse Beziehungen: Das Quadrat des Korrelationskoeffizienten ist identisch mit dem »Determinationskoeffizienten $ R^{2}$«, und $ r$ selbst entspricht dem standardisierten »Regressionskoeffizienten«. Das eröffnet zusätzliche Möglichkeiten der Interpretation.

Beispiele: Die Korrelation zwischen der Abiturnote in Mathematik und der Note in der Statistikklausur betrage $ r=0,4$. Dies ist ein mittlerer positiver Zusammenhang: je besser die Mathematiknote, desto besser das Klausurergebnis. 16% ( $ =100 \cdot r^{2}$) der Varianz der Klausurnoten kann durch die Abiturnote erklärt werden, und da $ r$ ein symmetrisches Assoziationsmaß ist, gilt auch die umgekehrte Formulierung: 16% der Varianz der Abiturnoten kann durch die Klausurnote erklärt werden. Nimmt die Abiturnote um eine Standardabweichung zu, dann nehmen die Klausurnoten um 0,4 Standardabweichungen zu (und umgekehrt).

Notation: $ r$ in der Stichprobe, $ \rho$ (griech.: rho) in der Grundgesamtheit.


next up previous index
Nächste Seite: Varianzanalyse Aufwärts: Regression und Korrelation Vorherige Seite: Kovarianz und Kovariation   Index
HJA 2001-10-01