next up previous index
Nächste Seite: Kreuzproduktverhältnis (Odds Ratio) Aufwärts: Tabellenanalyse Vorherige Seite: Tabellenanalyse   Index


Prozentsatzdifferenz

Die Prozentsatzdifferenz (engl.: percentage difference) ist ein »Assoziationsmaß« für zwei »kategoriale Variablen«. Ausgangspunkt ist eine »Kreuztabelle« der beiden Variablen. Man vergleicht die bedingten Verteilungen der »Zielvariablen« $ Y$ für jeweils zwei verschiedene »Ausprägungen« der »unabhängigen Variablen« $ X$ und berechnet die Differenz der prozentualen »konditionalen Anteilswerte« der Ausprägungen von $ Y$. Hat man, wie empfohlen, die Zielvariable in den Zeilen der Kreuztabelle abgetragen, dann berechnet sich die Prozentsatzdifferenz aus den Spaltenprozenten.

Beispiele: Im Wintersemester 1975/76 waren im früheren Bundesgebiet 25% aller Studierenden in einem sozialwissenschaftlichen Fach eingeschrieben (konditionaler Anteil für WS 75/76). Im Wintersemester 1991/92 waren es 31% (konditionaler Anteil für WS 91/92).[*] Anders ausgedrückt: Der Anteil der Studierenden in den Sozialwissenschaften hat um 6 Prozentpunkte zugenommen (Prozentsatzdifferenz).

Hat die Zielvariable insgesamt $ r$ Ausprägungen ($ Y$ sollte in den Zeilen stehen, engl.: rows), dann kann man genau $ (r-1)$ voneinander unabhängige Prozentsatzdifferenzen berechnen, die $ r$-te Differenz ergibt sich aus den bereits berechneten. Bei $ r\times c$-Tabellen müssen daher mehrere Prozentsatzdifferenzen gleichzeitig betrachtet werden. Bei $ 2\times 2$-Tabellen vereinfacht sich die Situation, weil hier nur eine Prozentsatzdifferenz betrachtet werden muß.

Ähnliches gilt für die unabhängige Variable: Hat sie nicht zwei, sondern allgemein $ c$ Ausprägungen ($ X$ sollte in den Spalten stehen, engl.: columns), dann kann man genau ($ c-1$) bedingte Verteilungen miteinander vergleichen. Eine der insgesamt $ c$ Ausprägungen sollte man als Referenzkategorie auswählen, relativ zu der alle ($ c-1$) verbleibenden Ausprägungen betrachtet werden.

Der Wertebereich der Prozentsatzdifferenz geht von $ -100$ bis $ +100$, wobei der Wert 0 besagt, daß sich die Anteile der entsprechenden Ausprägung von $ Y$ unter den verschiedenen Bedingungen nicht unterscheiden. Im Fall einer $ 2\times 2$-Tabelle, in der nur eine Prozentsatzdifferenz berechnet werden muß, ist das gleichbedeutend mit der Aussage, daß beide Variablen $ X$ und $ Y$ statistisch nicht miteinander zusammenhängen. In größeren Tabellen, in denen mehrere Differenzen berechnet werden können, bedeutet der Wert 0 eine $ \dq$lokale$ \dq$ Unabhängigkeit bezüglich einer Kategorie. Die Maximalwerte ($ -100$, $ +100$) weisen in einer $ 2\times 2$-Tabelle auf einen perfekten Zusammenhang der beiden Variablen hin. Handelt es sich um Variablen ordinalen »Meßniveaus«, kann auch das Vorzeichen sinnvoll interpretiert werden. Man beachte schließlich, daß eine Differenz zweier »Prozentzahlen« immer in Prozentpunkten ausgedrückt wird. Von daher sollte die Prozentsatzdifferenz eigentlich besser Prozentpunktdifferenz heißen.

Notation: $ \Delta p\%$.


next up previous index
Nächste Seite: Kreuzproduktverhältnis (Odds Ratio) Aufwärts: Tabellenanalyse Vorherige Seite: Tabellenanalyse   Index
HJA 2001-10-01