next up previous index
Nächste Seite: Konditionale Odds Aufwärts: Tabellenanalyse Vorherige Seite: Kreuztabelle   Index


(Konditionale) Anteilswerte

»Anteilswerte« sind ein Maß für die relative Häufigkeit einzelner »Ausprägungen« einer »Variablen«. Sie werden häufig in Prozent ausgedrückt. In einer (bivariaten) »Kreuztabelle« geht es um die relative Häufigkeit einzelner Ausprägungskombinationen zweier »kategorialer Variablen« $ X$ und $ Y$. Man kann die Häufigkeit der Ausprägungskombination $ f_{ij}$ in Relation zur Gesamthäufigkeit $ f_{..}$, zur Gesamthäufigkeit einer Zeile $ f_{i.}$ oder zur Gesamthäufigkeit einer Spalte $ f_{.j}$ betrachten und erhält dementsprechend sogenannte Gesamtanteile, Zeilenanteile und Spaltenanteile. Werden diese Anteilswerte in Prozent ausgedrückt, spricht man auch von Gesamtprozenten, Zeilenprozenten und Spaltenprozenten (engl.: total, row, and column percentages). Die Gesamtanteile messen die bivariate relative Häufigkeitsverteilung insgesamt, während die Spaltenanteile jeweils die relative Häufigkeitsverteilung der Zeilenvariablen für die Untersuchungseinheiten angeben, die eine bestimmte Ausprägung bei der Spaltenvariablen aufweisen. Sie messen also die bedingte relative Häufigkeitsverteilung der Zeilenvariablen. Dementsprechend messen die Zeilenanteile die bedingte relative Häufigkeitsverteilung der Spaltenvariablen. Spalten- und Zeilenanteile werden daher auch konditionale Anteilswerte genannt (engl.: conditional proportion), während es sich bei den Gesamtanteilen um sogenannte unbedingte Anteilswerte handelt.

Da ein statistischer Zusammenhang der beiden Variablen $ X$ und $ Y$ am besten daran zu erkennen ist, daß die bedingten Verteilungen voneinander abweichen, verwendet man bei der Interpretation von Kreuztabellen in den meisten Fällen Spalten- oder Zeilenanteile. Folgt man der Empfehlung, die »Zielvariable« $ Y$ zur Zeilenvariable zu machen, dann sind also die bedingten relativen Häufigkeitsverteilungen von $ Y$ für verschiedene Ausprägungen von $ X$ (der Spaltenvariablen) zu vergleichen. Dementsprechend muß man die Spaltenanteile zeilenweise vergleichen. Hat man sich nicht an diese Empfehlung gehalten und betrachtet die Spaltenvariable als Zielvariable, dann muß man natürlich die Zeilenanteile verwenden und diese spaltenweise vergleichen.

Ein Nachteil der Spalten- und Zeilenanteile ist, daß sie sich jeweils nur auf eine Subgruppe aller Untersuchungseinheiten beziehen und daher den Eindruck über die relative Häufigkeit einer Ausprägungskombination verfälschen können. Möchte man also wissen, wie häufig eine Ausprägungskombination insgesamt vorkommt, muß man die Gesamtprozente betrachten.

Notation: $ C$ sei die Spaltenvariable (engl.: column variable) und $ R$ die Zeilenvariable (engl.: row variable) einer zweidimensionalen Kreuztabelle. Die Gesamtanteile $ (f_{ij}/f_{..})$ bezeichnet man mit $ p_{ij}$, wobei, wie bei den Häufigkeiten, der erste Index die Ausprägung der Zeilenvariablen und der zweite die Ausprägung der Spaltenvariablen bezeichnet. Um zu verdeutlichen, welche Variablen hier kombiniert wurden, kann man die entsprechenden Bezeichnungen im Superskript nennen: $ p^{RC}_{ij}$. Die Analyse einer Variablen unter der Bedingung, daß eine andere Variable einen bestimmten Wert aufweist, wird in der Statistik mit einem senkrechten Strich $ \vert$ gekennzeichnet. Spalten- und Zeilenanteile messen genau solche bedingten Verteilungen. Das erfordert eine Erweiterung der Notation. Den Spaltenanteil $ (f_{ij}/f_{.j})$ bezeichnet man mit $ p^{R\vert C}_{i\vert j}$. Damit ist der Anteil gemeint, mit dem die Ausprägung $ i$ der Zeilenvariablen $ R$ bei den Untersuchungseinheiten vorkommt, die bei der Spaltenvariablen $ C$ die Ausprägung $ j$ aufweisen. Da $ C=j$ die Bedingung ist, werden Variablenname $ C$ und Ausprägung $ j$ jeweils nach dem Strich $ \vert$ genannt. Bei den Zeilenanteilen $ (f_{ij}/f_{i.})$ sind dagegen die Ausprägungen der Zeilenvariablen $ R$ die Bedingung, und dementsprechend werden Zeilenanteile mit $ p^{C\vert R}_{j\vert i}$ bezeichnet. Merke: Bei Spaltenanteilen steht die Bedingung in den Spalten und die Ausprägungen der Zielvariablen in den Zeilen. Bei Zeilenanteilen steht die Bedingung in den Zeilen und die Ausprägungen der Zielvariablen in den Spalten.


next up previous index
Nächste Seite: Konditionale Odds Aufwärts: Tabellenanalyse Vorherige Seite: Kreuztabelle   Index
HJA 2001-10-01