Schwierigkeitsindex
Der Schwierigkeitsindex oder Index der kategorialen Häufigkeiten gibt an, wie groß der Anteil von Probanden in der Eichstichprobe ist, die ein Item richtig gelöst haben.
Ein Test soll entsprechend dem differentialdiagnostischen Ansatz der klassischen Testtheorie die Probanden mit hoher Merkmalsausprägung von denen mit geringer Merkmalsausprägung trennen. Zu einer solchen Unterscheidung tragen zwei Gruppen von Items nichts bei: einerseits solche, die von allen Probanden der Eichstichprobe gelöst werden und somit zu leicht sind sowie andererseits solche, die von keinem Probanden der Eichstichprobe gelöst werden und damit zu schwer sind. Nur diejenigen Items sind also "brauchbar", die von einem Teil der Probanden gelöst und von einem anderen Teil nicht gelöst werden.
Erwünschte Schwierigkeitsindizes:
- Bei Schnelligkeitstest (speed tests) ist die Durchführungszeit begrenzt. Die Leistung wird gemessen durch die Anzahl der in einer bestimmten Zeit richtig gelösten Items. Starke Probanden lösen in der vorgegebenen Zeit viele, schwache Probanden wenige Items. Bei dieser Testart sollten der Schwierigkeitsgrad der Aufgaben möglichst gleich und niedrig sein.
- Bei Niveau-Tests (power tests) ist die Durchführungszeit unbegrenzt und die Probanden bearbeiten die Items, die sie lösen können. Meist wird der Test nach einer bestimmten Anzahl nicht gelöster oder falsch gelöster Items abgebrochen.
Die Items oder Aufgaben sind in solchen Tests nach aufsteigender Schwierigkeit geordnet, das heißt auf leichtere Items folgen schwerere. Die Leistung wird dabei in der Regel durch die Anzahl der richtig gelösten Items gemessen.
- Mischtests fordern sowohl Schnelligkeit als auch Nivauleistung. Die Aufgaben werden in aufsteigender Schwierigkeit angeordnet und die Bearbeitungszeit ist begrenzt. Der Schwierigkeitsgrad der Aufgaben bewegt sich dabei in einem mittleren Bereich. Die Leistung wird gemessen durch die Anzahl der in der vorgegebenen Zeit richtig gelösten Items.
Berechnung des Schwierigkeitsindex:
Schwierigkeitsindex bei zweifach abgestuften Antworten (Ja-Nein-Antworten)
Der Schwierigkeitsindex für ein bestimmtes Item (P) berechnet sich in solchen Fällen als Quotient aus der Anzahl der Richtiglöser (NR) und der Anzahl aller Probanden (N):
P = NR / N
Haben nicht alle Probanden das entsprechende Item bearbeitet, so wird N durch die Anzahl der Probanden ersetzt, die das jeweilige Item bearbeitet haben (NB).
P = NR / NB
Der Schwierigkeitsindex ist also die Wahrscheinlichkeit, mit der ein bestimmtes Item innerhalb der Eichstichprobe gelöst wird. Ein Item, das von vielen gelöst wird erhält einen hohen Wert P und ist damit von seinem Schwierigkeitsgrad eher leicht, während sich für ein Item, das von wenigen Probanden der Eichstichprobe richtig gelöst wird ein niedriger P-Wert ergibt, was ausdrückt, dass dieses Item eher zu den schwereren zählt.
Beispiel:
1 = Item gelöst, 0 = Item nicht gelöst, n = Item nicht bearbeitet
NR = Zahl der Richtiglöser
NB = Zahl der Probanden, die ein Item bearbeitet haben
N = Zahl der Probanden, die beteiligt waren
Pbn |
Items 1 2 4 7 10 ..................................... |
1 2 3 4 5 6 7 |
1 1 1 1 n
0 0 1 1 n
1 0 1 1 0
0 0 1 1 0
1 0 0 1 0
0 0 n 1 0
1 1 n 1 0
|
NR NB N< |
4 2 4 7 0
7 7 5 7 5
7 7 7 7 7 |
P |
.57 .28 .80 1.0 .0 |
Aufgrund dieser Berechnungen werden die Items 7 und 10 aus dem Itempool entfernt, da sie bei der Differenzierung zwischen "guten" und "schlechten" Lösern nicht hilfreich sind.
Item 4 zählt eher zu den leichten Items und Item 2 zu den schweren. Item 1 besitzt einen mittleren Schwierigkeitsgrad.
Anordnung zum Beispiel in einem Niveau-Test:
Item 4 -> Item 1 -> Item 2
|