next up previous index
Nächste Seite: Lineare Einfachregression Aufwärts: Ausgewählte Formeln Vorherige Seite: -Transformation   Index

Assoziationsmaße

  1. Prozentsatzdifferenz

    1. Prozentsatzdifferenz der Spaltenanteile

      Wenn die abhängige Variable die Zeilenvariable $ R$ ist, dann muß man die Prozentsatzdifferenz auf der Basis der Spaltenanteile berechnen. Die Prozentsatzdifferenz für die Ausprägung $ R=i$ entspricht:

      $\displaystyle \Delta p\% = 100 \cdot (p^{R\vert C}_{i\vert j} - p^{R\vert C}_{i\vert j'})$    

      $ p^{R\vert C}_{i\vert j}$ = konditionaler Anteilswert der Ausprägung $ R=i$ unter der Bedingung $ C=j$
      $ p^{R\vert C}_{i\vert j'}$ = konditionaler Anteilswert der Ausprägung $ R=i$ unter der Bedingung $ C=j'$

    2. Prozentsatzdifferenz der Zeilenanteile

      Wenn die abhängige Variable die Spaltenvariable $ C$ ist, dann muß man die Prozentsatzdifferenz auf der Basis der Zeilenanteile berechnen. Die Prozentsatzdifferenz für die Ausprägung $ C=j$ entspricht:

      $\displaystyle \Delta p\% = 100 \cdot (p^{C\vert R}_{j\vert i} - p^{C\vert R}_{j\vert i'})$    

      $ p^{C\vert R}_{j\vert i}$ = konditionaler Anteilswert der Ausprägung $ C=j$ unter der Bedingung $ R=i$
      $ p^{C\vert R}_{j\vert i'}$ = konditionaler Anteilswert der Ausprägung $ C=j$ unter der Bedingung $ R=i'$

    Wertebereich: $ -100\leq \Delta p\%\leq +100$.

  2. Odds Ratio (Kreuzproduktverhältnis)

    1. Odds Ratio der Spaltenodds

      Wenn die abhängige Variable die Zeilenvariable $ R$ ist, dann muß man das Odds Ratio auf der Basis der Spaltenodds berechnen. Das Odds Ratio für die Ausprägung $ R=i$ versus $ R=i'$ entspricht:

      $\displaystyle OR = \frac{o^{R\vert C}_{i/i'\vert j}}{o^{R\vert C}_{i/i'\vert j'}}$    

      $ o^{R\vert C}_{i/i'\vert j}$ = konditionale Odds der Ausprägung $ R=i$ versus $ R=i'$ unter der Bedingung $ C=j$
      $ o^{R\vert C}_{i/i'\vert j'}$ = konditionale Odds der Ausprägung $ R=i$ versus $ R=i'$ unter der Bedingung $ C=j'$

    2. Odds Ratio der Zeilenodds

      Wenn die abhängige Variable die Spaltenvariable $ C$ ist, dann muß man das Odds Ratio auf der Basis der Zeilenodds berechnen. Das Odds Ratio für die Ausprägung $ C=j$ versus $ C=j'$ entspricht:

      $\displaystyle OR = \frac{o^{C\vert R}_{j/j'\vert i}}{o^{C\vert R}_{j/j'\vert i'}}$    

      $ o^{C\vert R}_{j/j'\vert i}$ = konditionale Odds der Ausprägung $ C=j$ versus $ C=j'$ unter der Bedingung $ R=i$
      $ o^{C\vert R}_{j/j'\vert i'}$ = konditionale Odds der Ausprägung $ C=j$ versus $ C=j'$ unter der Bedingung $ R=i'$

    Wertebereich: $ 0 < OR < +\infty .$

  3. Maße auf der Basis von Pearsons $ X^2$

    1. Pearsons $ X^2$

      $\displaystyle X^2 = \sum \limits_{i=1}^{r} \sum \limits_{j=1}^{c} \frac{(f_{ij}-\hat F_{ij})^2}{\hat F_{ij}}$   mit $\displaystyle \hat F_{ij}=\frac{\text{Zeilensumme} \cdot \text{Spaltensumme}}{\text{Gesamtsumme}}=\frac{(f_{i.}) \cdot (f_{.j})}{f_{..}}$    

      $ r$ = Anzahl der Zeilen (rows) der Tabelle
      $ i$ = Laufindex über die Zeilen ( $ i=1, \ldots, r$)
      $ c$ = Anzahl der Spalten (columns) der Tabelle
      $ j$ = Laufindex der Spalten ( $ j=1, \ldots, c$)
      $ f_{ij}$ = beobachtete Häufigkeit der Auspr„gungskombination $ ij$
      $ \hat F_{ij}$ = erwartete Häufigkeit der Auspr„gungskombination $ ij$
      $ min(r,c)$ = Minimum der Zeilen- oder Spaltenanzahl ($ r$ bzw. $ c$) der Tabelle

      Wertebereich: $ 0 \leq X^2 \leq n \cdot min(r,c).$

    2. Cramers $ V$

      $\displaystyle V = \sqrt {\frac{X^2}{n \cdot (min(r,c)-1)} }$    

      $ X^2$ = Pearsons $ X^2$
      $ min(r,c)$ = Minimum der Zeilen- oder Spaltenanzahl ($ r$ bzw. $ c$) der Tabelle
      $ n$ = Anzahl der Untersuchungseinheiten

      Wertebereich: $ 0 \leq V \le 1$

  4. Determinationskoeffizient $ \eta^2$

    $\displaystyle \eta^2 = \frac{SAQ_y - SAQI_y}{SAQ_y} = \frac{SAQZ_y}{SAQZ_y + SA...
...s_{j=1}^{g}}n_j (\bar y_j - \bar y)^2 + {\sum \limits_{j=1}^{g}}(n_j - 1)s_j^2}$    

    $ SAQ_y$ = Summe der Abweichungsquadrate von $ Y$ innerhalb der gesamten Stichprobe
    $ SAQZ_y$ = Summe der Abweichungsquadrate von $ Y$ zwischen den durch $ X$ definierten Subgruppen
    $ SAQI_y$ = Summe der Abweichungsquadrate von $ Y$ innerhalb der durch $ X$ definierten Subgruppen
    $ g$ = Anzahl der Subgruppen (= Anzahl der Ausprägungen von $ X$)
    $ j$ = Laufindex über die Subgruppen $ (j=1,\dots,g$)
    $ n_j$ = Umfang der Subgruppe mit $ X=j$
    $ \bar y_j$ = arithmetisches Mittel von $ Y$ in der Subgruppe mit $ X=j$
    $ \bar y$ = arithmetisches Mittel von $ Y$ in der Stichprobe insgesamt
    $ s_j^2$ = Varianz von $ Y$ in der Subgruppe $ X=j$

    Wertebereich: $ 0\leq \eta^2\leq 1$

  5. Korrelationskoeffizient $ r$

    $\displaystyle r=\frac{s_{xy}}{s_x \cdot s_y} = \frac{SAP_{xy}}{\sqrt{SAQ_x\cdot...
...ft( x_i-\bar x\right)^2\cdot \sum \limits_{i 1}^{n}\left( y_i-\bar y\right)^2}}$    

    $ s_{xy}$ = Kovarianz von $ X$ und $ Y$
    $ s_x$ = Standardabweichung von $ X$
    $ s_y$ = Standardabweichung von $ Y$
    $ SAP_{xy}$ = Summe der Abweichungsprodukte von $ X$ und $ Y$
    $ {SAQ}_x$ = Summe der Abweichungsquadrate von $ X$
    $ {SAQ}_y$ = Summe der Abweichungsquadrate von $ Y$
    $ x_i$ = Wert von $ X$ bei der Untersuchungseinheit $ i$
    $ \bar x$ = arithmetisches Mittel von $ X$
    $ y_i$ = Wert von $ Y$ bei der Untersuchungseinheit $ i$
    $ \bar y$ = arithmetisches Mittel von $ Y$

    Wertebereich: $ -1\leq r\leq +1$


next up previous index
Nächste Seite: Lineare Einfachregression Aufwärts: Ausgewählte Formeln Vorherige Seite: -Transformation   Index
HJA 2001-10-01