next up previous index
Nächste Seite: Arten von Drittvariableneffekten Aufwärts: Multivariate Analyse Vorherige Seite: Drittvariablenkontrolle bei kategorialen Variablen   Index


Drittvariablenkontrolle bei kontinuierlichen Variablen

Für die Analyse »kontinuierlicher Variablen« sind Verfahren der »Regressionsanalyse« geeignet. Die Kontrolle von Drittvariablen durch Konstanthaltung kann man sich gedanklich so ähnlich vorstellen wie entsprechende Verfahren der »Drittvariablenkontrolle für kategoriale Daten«: Das bivariate Regressionsmodell, $ \hat y_{i}= b_{0} + b_{1} x_{i}$, wird nicht nur für die gesamte Stichprobe, sondern auch für verschiedene Subgruppen von »Untersuchungseinheiten« bestimmt, die jeweils bei der Drittvariablen $ Z$ die gleiche »Ausprägung« aufweisen. Der in den Subgruppen sichtbare Zusammenhang zwischen $ X$ und $ Y$ ist insofern um den Einfluß von $ Z$ bereinigt, als sich die Untersuchungseinheiten der Subgruppe nicht mehr bezüglich $ Z$ unterscheiden. Sie haben bei $ Z$ alle die gleiche Ausprägung. Die in den Subgruppen geschätzten Regressionskoeffizienten bezeichnet man auch als konditionale Regressionskoeffizienten. Hat die Drittvariable $ Z$ insgesamt $ z$ Ausprägungen, gibt es insgesamt $ z$ verschiedene konditionale Regressionskoeffizienten. Ein partieller Regressionskoeffizient ergibt sich, indem man die konditionalen geeignet mittelt. Dieser partielle Regressionskoeffizient mißt den Einfluß der unabhängigen Variablen $ X$ unter Kontrolle der Drittvariablen $ Z$. Er entspricht dem multiplen Regressionskoeffizenten $ c_{1}$ der trivariaten Regression: $ \hat y_{i}= c_{0} + c_{1} x_{i} + c_{2} z_{i}$.

Durch ein ähnliches Gedankenexperiment kann man sich das Zustandekommen des multiplen Regressionskoeffizienten $ c_{2}$ für die Variable $ Z$ vorstellen. Jetzt fungiert $ X$ als Drittvariable, und es werden konditionale Regressionsmodelle in den durch $ X$ definierten Subgruppen berechnet. In beiden Fällen handelt es sich jedoch um ein Gedankenexperiment, das den Grundgedanken der statistischen Kontrolle verdeutlichen soll. Die tatsächliche Berechnung der multiplen Regressionskoeffizienten beruht auf einem effizienteren Algorithmus.

Eine weitere Schwierigkeit kommt hinzu: Hat $ Z$ ebenso wie $ X$ und $ Y$ viele Ausprägungen, dann ist eine Berechnung konditionaler Regressionsmodelle nicht mehr möglich. Es gibt zu viele Subgruppen, die häufig nur aus einer Untersuchungseinheit bestehen, so daß mangels einer entsprechenden Anzahl von Beobachtungen keine (konditionale) Regression für die entsprechende Subgruppe berechnet werden kann. Man muß daher gleich zur Berechnung des partiellen Regressionskoeffizienten kommen und dazu die Informationen aus den verschiedenen Subgruppen so miteinander kombinieren, daß sich ein $ \dq$durchschnittlicher$ \dq$ Effekt von $ X$ auf $ Y$ über die verschiedenen Subgruppen, also unter Kontrolle von $ Z$, ergibt.

Die Kontrolle der Drittvariablen bezeichnet man auch als Auspartialisieren (daher auch die Bezeichnung partieller Regressionskoeffizient). Folgende Identität für das trivariate Regressionsmodell macht deutlich, was damit gemeint ist. Angenommen, man berechnet eine Regression der unabhängigen Variablen $ X$ auf die Drittvariable $ Z$: $ \hat x_{i}= d_{0} + d_{1} z_{i}$. $ (\hat x_{i} - x_{i})$ seien die Residuen dieser Regression, also die Teile der Variablen $ X$, die nicht durch die Drittvariable $ Z$ erklärt werden können. Berechnet man in einem zweiten Schritt eine bivariate Regression der abhängigen Variablen $ Y$ auf diese Residuen von $ X$, dann entspricht der Regressionskoeffizient dieser bivariaten Regression dem multiplen Regressionskoeffizienten $ c_{1}$ der trivariaten Regression: $ \hat y_{i}= c_{0} + c_{1} x_{i} + c_{2} z_{i}$. Anders ausgedrückt: Der multiple bzw. partielle Regressionskoeffizient einer unabhängigen Variablen $ X$ mißt den Einfluß der Bestandteile dieser Variablen, die nicht durch die anderen Variablen des Regressionsmodells (hier: $ Z$) erklärt werden können. Auspartialisieren meint also: um die durch die anderen Variablen erklärten Anteile bereinigen.


next up previous index
Nächste Seite: Arten von Drittvariableneffekten Aufwärts: Multivariate Analyse Vorherige Seite: Drittvariablenkontrolle bei kategorialen Variablen   Index
HJA 2001-10-01