Validität (Gültigkeit)
Für ein psychometrisches Verfahren reicht es nicht aus, lediglich seine Messgenauigkeit unter Beweis zu stellen, sondern es muss auch valide sein. Die Validität gibt den Grad der Genauigkeit an, mit der ein Test dasjenige Merkmal tatsächlich misst, das er messen soll oder vorgibt zu messen. Ein Test der vorgibt, Intelligenz zu erfassen, muss nachweisen, in welchem Ausmaß er dies wirklich tut. Er ist nur valide, wenn gezeigt werden kann, dass er das Merkmal Intelligenz misst und kein anderes. Bei einem Testvefahren, das beispielsweise vorgibt logisches Denkvermögen zu erfassen, könnte die Gefahr bestehen, dass Kinder die Aufgaben wegen ihres geringen Sprachverständnisses nicht lösen können. Sie verstehen die sprachlich recht anspruchsvolle Instruktion und damit die Aufgabenstellung nicht. Diese Kinder scheitern hier nicht aufgrund mangelnder Fähigkeit zum logischen Denken, die der Test vorgibt, zu erfassen, sondern an sprachlichen Mängeln. Die Validität eines solchen Verfahrens wäre demnach sehr gering.
Bei der Frage nach der Validität geht es jedoch nicht immer ausschließlich darum, ein Individuum auf einer bestimmten Dimension mit bestimmter Metrik zu lokalisieren. Manchmal werden Tests auch für einen spezifischen Zweck konstruiert, um zum Beispiel bestimmte Entscheidungen (Ausleseentscheidungen) zu treffen. Validität meint unter diesem Gesichtspunkt, in wie weit sich ein psychometrisches Verfahren für den geplanten Zweck eignet, zum Beispiel ob die auf der Basis seines Messergebnisses getroffenen Ausleseentscheidungen richtig sind. Validität ist in einem solchen Fall keine generelle Eigenschaft eines Tests, sondern der Test ist für einen ganz bestimmten Zweck valide und für einen anderen nicht.
Die klassische Testtheorie kennt vor allem drei Arten von Validität:

- Inhaltsvalidität
Inhaltliche Validität ist dann gegeben, wenn der Inhalt der Test-Items das Zielmerkmal hinreichend genau definiert. Die inhaltliche Analyse der Items lässt erkennen, welches Merkmal erfasst werden soll.
In der Praxis werden Experten, die mit dem Zielmerkmal vertraut sind gebeten, zu beurteilen, ob der Test auch tatsächlich das Merkmal misst, das er messen soll. Im allgemeinen ist es nicht möglich die Inhaltsvalidität numerisch zu bestimmen. Sie wird vielmehr aufgrund logisch-fachlicher Überlegungen akzeptiert oder verworfen.
Die Qalität dieser Validitätsbestimmung hängt davon ab, wie exakt das zu messende Merkmal definiert werden kann und in welchem Ausmaß die Experten selbst valide sind.
- Kriteriumsbezogenen Validität
Die Kriteriumsbezogene oder empirische Validität wird ermittelt durch den Vergleich der Test-Scores mit Kriterien-Scores. In der Regel wird der Grad der Übereinstimmung als Korrelationskoeffizient ausgedrückt.
Bei der Kriteriumsbezogenen Validität wird in Übereinstimmungs- und Vorhersagevalidität unterschieden.
Übereinstimmungsvalidität besteht in der Übereinstimmung zwischen Test-Scores und solchen Kriterien-Scores, die gleichzeitig mit den Test-Scores erhoben werden. Von denselben Probanden liegen demzufolge zwei zeitgleiche Messwertreihen vor: Test-Scores und Kriterien-Scores. Welches Merkmal die Kriterien-Scores repräsentieren ist bekannt. Ergibt sich nun ein enger statistischer Zusammenhang zwischen den Test-Scores und den Kriterien-Scores wird angenommen, dass auch der zu überprüfende neue Test dasselbe Merkmal misst wie das Kriterium. Voraussetzung ist, dass das Kriterium selbst bereits über eine zufriedenstellende Validität verfügt.
Beispiel:
Für den Grundintelligenztest CFT 3 soll die Übereinstimmungsvalidität errechnet werden. Die Testautoren suchen zunächst nach möglichen Kriterien. Dies sind in unserem Beispiel andere Intelligenztests (Intelligenzstrukturtest nach Amthauer IST, Prüfsystem für Schul- und Bildungsberatung nach Horn PSB) und Schulnoten. Einer Gruppe von Probanden werden dann alle ausgewählten Testverfahren zur Bearbeitung vorgelegt und gleichzeitig werden auch noch ihre momentane Schulnoten erfragt. Die Test-Scores des CFT 3 werden nun mit den Kriterien-Scores (Test-Scores von IST und PSB, Schulnoten) korreliert.
Vergleich |
r(te) |
N (Stichprobengröße) |
CFT x IST CFT x PSB CFT x Noten- Mathe.-Gymnasium
- Mathe. - Realschule
|
.68 .66
.53 .58 |
579 61
72 90 |
(aus: Fisseni, H-J. Lehrbuch der psychologischen Diagnostik. Göttingen 1990, S. 79)
|
Vorhersagevalidität oder prognostische Validität besteht in der Übereinstimmung zwischen Test-Score und solchen Kriterien-Scores, die später als der Test-Score erhoben werden.
Zur Ermittlung der Vorhersagevalidität wird bei einer Gruppe von Probanden ein Testergebnis ermittelt zum Beispiel bezüglich deren schulischer Leistungen. Auf der Basis dieser Testleistungen wird nun das zukünftige Lern- und Leistungsverhalten der Probanden in der Realschule oder auf dem Gymnasium vorhergesagt. Die Vorhersagevalidität wir dann berechnet als Korrelation zwischen der Testleistung und der späteren tatsächlichen Schulleistung. Es wird auf diese Weise überprüft, inwieweit die Prognose über das Leistungsverhalten zutrifft.
- Konstruktvalidität
Beim Ermitteln der Konstruktvalidität geht es um die Frage, wie gut ein Test mit der Theorie übereinstimmt, von der seine Testkonstruktion ausging. Grundlage jeder Testkonstruktion sind aus Theorie oder Empirie gewonnene hypothetische Konstrukte (Intelligenz, Angst, Aggression). Test stellen somit nichts anderes dar als Operationalisierungsversuche von Persönlichkeitskonstrukten, die in ein nomologisches Netzwerk eingebaut sind, so dass exakt prüfbare Voraussagen und Ableitungen möglich werden.
Die Konstruktvalidierung ist somit vergleichbar mit dem Finden und Prüfen einer Theorie, die das Erklären eines Testverhaltens ermöglicht. Ein Test müsste dementsprechend mit anderen Kriterien korrelieren, die gemäß der vorliegenden Theorie mit dem Konstrukt verbunden sind (konvergente Validität). Andererseits dürfte er nicht mit solchen Merkmalen korrelieren, die von der Theorie ausgeschlossen werden (divergente Validität).
Beispiel:
Bei der Validierung des "IPC-Fragebogens zu Kontrollüberzeugungen wurde die Beziehung der Skalen des Fragebogens zu theoretisch verwandten und theoretisch entfernten Konstrukten ermittelt. (Kontrollüberzeugung betrifft die Frage, ob ein Individuum sein Verhalten stärker bestimmt sieht von Faktoren innerhalb oder außerhalb der eigenen Person.)
Die Skala C im IPC-Fragebogen repräsentiert Gefühle der Abhängigkeit vom Schicksal.
Im Sinne der konvergenten Validität werden für diese Skala höhere Korrelationen berichtet zu verwandten Konstrukten wie Hoffnungslosigkeit, Depressivität, Rigidität usw. Im Sinne der divergenten Validität wurden niedrige Korrelationen gefunden zu entfernteren Konstrukten wie Aggressivität, Geselligkeit, Gelassenheit usw.
(aus Fisseni, H-J. Lehrbuch der psychologischen Diagnostik. Göttingen 1990, S.87f)
|
Einen bevorzugten Platz innerhalb der Konstruktvalidierung nimmt die Faktorenanalyse ein. Faktorielle Validität eines Tests kann die Übereinstimmung der Ladungen eines Tests mit theoretisch bedeutungsvollen Dimensionen oder Faktoren bezeichnen, die in einer faktorenanalytischen Untersuchung vieler Tests oder anderer Variablen gefunden wurde.