Reliabilität (Messpräzision)
Die Reliabilität charakterisiert das Messinstrument "psychologischer test" unter dem Aspekt der Präzision. Sie wird verstanden als der Grad der Genauigkeit, mit dem der Test ein bestimmtes Merkmal misst, unabhängig davon, ob der Test auch tatsächlich das misst, was er vorgibt zu messen.
Diese Definition von Reliabilität basiert auf den Axiomen der klassischen Testtheorie. Das erste Axiom sagt aus, dass jede Messung, also jeder beobachtete Wert (X) zusammengesetzt ist aus dem wahren Wert (true score: T) und einem Fehlerwert (error: E).
X = T + E
Daraus ist ableitbar, dass die Reliabilität eines psychometrischen Verfahrens (rtt) als Verhältnis der wahren Varianz (sT2) zur Gesamttestvarianz (sx2) bestimmt werden kann.
rtt = sT2 / sx2 (Gleichung 1)
Da laut Axiom 1 der klassischen Testtheorie jeder beobachtete Wert aus dem wahren Wert und einem Fehler besteht gilt auch, dass sich die beobachtete Varianz (sx2) aus der Summe der wahren Varianz (sT2) und der Fehlervarianz (sE2 )zusammensetzt.
(sx2) = sT2 + sE2
sT2 = (sx2) - sE2 (Gleichung 2)
Wird Gleichung 2 in Gleichung 1 eingesetzt, ergibt sich für die Reliabilität:
rtt = 1 - (sE2 / (sx2))
Die Messgenauigkeit oder Reliabilität eines psychometrischen Verfahrens lässt sich auf verschiedenen Weise schätzen:

- Retestreliabilität oder Wiederholungsreliabilität
Der Test wird den gleichen Probanden zu verschiedenen Zeitpunkten zur Bearbeitung vorgelegt. Die Test-Scores der einzelnen Messungen werden miteinander korreliert. Die Höhe des Koeffizienten gilt als Schätzung der Reliabilität.
Die Methode der Retestreliabilität beruht auf einer fundamentalen Voraussetzung: Das zu messende Merkmal muss relativ stabil sein. Problematisch ist damit der Zeitpunkt der Wiederholungsuntersuchung. Er muss einen gewissen zeitlichen Abstand zur ersten Messung besitzen, damit sich die Probanden nicht an frühere Lösungen erinnern können und die beiden Messzeitpunkte dürfen auch nicht zu weit auseinanderliegen, da sich sonst - vor allem bei Kindern - Merkmalsveränderungen aufgrund von Entwicklungsprozessen ergeben.
Korrelationskoeffizienten (=Reliabilitätskoeffizienten) sollten bei dieser Methode über r = .9 liegen.
- Paralleltestreliabilität
Die Paralleltestmethode wird bestimmt als Korrelation zwischen Test A und seinem Paralleltest B bei denselben Probanden. Denselben Probanden wird demnach zunächst Test A vorgelegt, dann ein Paralleltest B. Die Übereinstimmung der Test-Scores, ermittelt als Korrelation, gilt als Indikator für die Reliabilität.
Voraussetzung für diese Methode ist, dass von einem Test zwei gleichwertige Formen vorhanden sind.
Für einen guten Test sollte der Reliabilitätskoeffizient bei dieser Methode mindestens r = .85 betragen.
- Halbierungsreliabilität oder Split-half-reliabilität
Diese Methode findet vor allem dann Anwendung, wenn das zu messende Merkmal relativ instabil ist. Der Test wird mit einer Probandengruppe (Stichprobe) einmal durchgeführt. Anschließend wird der Test in zwei gleichwertige Hälften aufgeteilt. Für jeden Probanden ergeben sich nun zwei Test-Scores, einer für die erste und einer für die zweite Testhälfte. Diese beiden Test-Scores werden miteinander korreliert und die Höhe der Übereinstimmung gilt wiederum als Indikator für die Reliabilität.
Der Reliabilitätskoeffizient für einen guten Test sollte bei dieser Methode r = .9 oder mehr betragen.
- Konsistenz
Die Konsistenz kann als Erweiterung der Halbierungsmethode verstanden werden. Ein test wird in so viele Teile zerlegt, wie er Items besitzt. Der Reliabiltätskoeffizient geht dabei aus der Korrelation der einzelnen Items miteinander hervor.