next up previous index
Nächste Seite: Rohdaten (Urliste) Aufwärts: Datenaufbereitung Vorherige Seite: Gültige und fehlende Werte   Index


Dummy-Variable

Hat eine Variable $ X$ wenige »Ausprägungen«, dann bezeichnet man sie als »kategoriale Variable«. Angenommen, diese Variable hat insgesamt $ c$ Ausprägungen (engl.: categories). Für einige statistische Auswertungen ist es hilfreich zu wissen, ob eine Untersuchungseinheit eine dieser $ c$ Ausprägungen aufweist oder nicht. Zu diesem Zweck bildet man eine sogenannte Stellvertreter-Variable $ D$ (engl.: dummy variable) mit den Ausprägungen 1 und 0: eine 1/0-kodierte Dummy-Variable. $ D=1$ bei einer Untersuchungseinheit bedeutet, daß die Untersuchungseinheit die interessierende Ausprägung aufweist. $ D=0$ bedeutet, daß sie eine andere Ausprägung aufweist. Auf die gleiche Weise kann man Dummy-Variablen für die anderen Ausprägungen von $ X$ bilden. Bei insgesamt $ c$ Ausprägungen sind im Prinzip $ c$ Dummies denkbar: $ D_{1}, D_{2}, \ldots, D_{c}$. Man kann sich jedoch leicht überlegen, daß man lediglich $ (c-1)$ Dummies benötigt, um die $ c$ Ausprägungen vollständig abzubilden: Hat eine Untersuchungseinheit die Ausprägung $ X=c$, dann erkennt man das daran, daß alle $ (c-1)$ Dummies den Wert 0 aufweisen: $ D_{1}=0, D_{2}=0, \ldots, D_{c-1}=0$.



HJA 2001-10-01