zurück

Objektivität (Standardisierung)

Unter der Objektivität eines Testverfahrens wird der Grad verstanden, in dem die Ergebnisse eines Tests unabhängig sind vom Untersucher. Ein Test wäre demnach vollkommen objektiv, wenn verschiedene Untersucher bei demselben Probanden zu gleichen Ergebnissen gelangten. Diese Unabhängigkeit der Ergebnisse vom Anwender soll durch eine weitgehende Standardisierung von Durchführung, Auswertung und Interpretation erreicht werden. Die Testautoren legen möglichst genau fest, auf welche Weise und unter welchen Bedingungen die einzelnen Aufgaben oder Fragen gestellt werden, wie die Lösungen und Antworten der Probanden zu bewerten sind und welche Aussagen aufgrund der vorliegenden Ergebnisse über das zu messenden Merkmal zu treffen sind. Objektivität bezieht sich somit auf die einzelnen Phasen des testdiagnostischen Prozesses.


Darstellung der Facetten des Hauptgütekriteriums Objektivität



  1. Durchführungsobjektivität

    Dieser Aspekt der Frage betrifft die Bedingungskonstanz in der Testdurchführung.

    Um die Durchführungsobjektivität zu maximieren wird zum Beispiel bei psychometrischen Verfahren auf die Gleichheit der Aufgabenstellung oder Instruktion geachtet. Diese liegt meist schriftlich vor und sollte nach Möglichkeit auch wortwörtlich vorgetragen werden. Durch vorgeschaltete Übungsaufgaben, die nicht in die Bewertung miteinbezogen werden, wird sicher gestellt, dass die Probanden die Testanweisung oder Aufgabenstellung auch richtig verstanden haben. Bei der Untersuchung von Menschen mit Behinderungen (Geistigbehinderte, Sprachbehinderte) sind die Instruktionen hin und wieder sprachlich so anspruchsvoll gestaltet, dass sie von diesen nicht, nur teilweise oder falsch verstanden werden. In diesen Fällen ist der Untersucher gezwungen von der standardisierten Instruktion abzuweichen und nach einfacheren sprachlichen Strukturen zu suchen. Dabei sollte er aber darauf achten, dass alle Elemente der Instruktion in der sprachlich vereinfachten Testanweisung enthalten sind und keine zusätzlichen unerlaubten Hilfen durch Umformulierung der Instruktion gegeben werden. Gleichzeitig erhält der Untersucher bei dieser Gelegenheit wichtige Zusatzinformationen über das Sprachverständnis des Probanden, die notiert werden sollten, um sie bei der Interpretation der Ergebnisse, beim weiteren diagnostischen Vorgehen und selbstverständlich bei der Beantwortung der diagnostischen Fragestellung berücksichtigen zu können.

    Darüber hinaus sollte jeder Proband bezüglich der diagnostischen Gesamtsituation vergleichbare Bedingungen vorfinden. Hiermit ist im Grunde ein paradoxes Ziel formuliert. Der Testleiter soll mit dem Probanden in Interaktion treten, ohne dass sich diese Interaktion jedoch auf die Zusammenarbeit der beiden auswirkt. Der Untersucher ist gehalten eine freundliche, entspannte und angstfreie Atmosphäre zu schaffen. Die Probanden sollten möglichst optimal für die Bearbeitung der Aufgaben motiviert sein. Alle denkbaren Störungen sind zu vermeiden. Problematisch ist oft die Testdurchführung in diesem Zusammenhang bei lern- oder geistigbehinderten Menschen mit Konzentrations- und Aufmerksamkeitsstörungen. Ihre Aufmerksamkeitsspanne und Ausdauer ist manchmal so stark eingeschränkt, dass zusätzliche Pausen, Strukturierungs- und Motivationshilfen erforderlich sind. Auch solche Abweichungen von der Standardisierung sind einerseits zu notieren und bei der Auswertung zu berücksichtigen und können andererseits als wichtige zusätzliche diagnostische Informationen betrachten werden. Eine standardisierte Durchführung wird ebenfalls erschwert durch nicht vorhersehbare Fragen der Probanden bezüglich der Durchführung und Lösung der Aufgaben. Solche Fragen sollten natürlich beantwortet werden, jedoch so, dass keine über die standardisierte Instruktion hinausgehenden Hilfen in den Antworten enthalten sind. Unsichere Kinder fragen zum Beispiel sehr häufig nach, ob ihre Lösungen richtig sind. Werden solche Fragen vom Untersucher wahrheitsgemäß bejaht oder verneint, könnte sich dies auf die weitere Motivation der Kinder positiv oder negativ auswirken. Möglichst neutrale Antworten, die beinhalten, dass solche Fragen nicht nötig sind und vom Untersucher nicht beantwortet werden, können hier hilfreich sein.



  2. Auswertungsobjektivität

    Die Auswertungsobjektivität besteht grundsätzlich darin, dass gleichen Antworten oder Lösungen gleiche nummerische Werte oder Itemscores zugeordnet werden.

    Leicht gelingt dies bei gebundenen Items, die zum Beispiel mehrer Antwortmöglichkeiten vorgeben, von denen der Proband eine auswählen muss, oder bei Items die mit "ja" und "nein", "richtig" oder "falsch" zu beantworten sind.

    Schwieriger gestaltet sich die objektive Auswertung bei freien Items, die dem Probanden eine individuell gestaltete Antwort ermöglichen. Als Hilfe bieten die Testautoren in solche Fällen ausführliche Auswertungsschlüssel mit Bewertungsrichtlinien an.

    Beispiele aus dem Hamburg-Wechsler Intelligenztest für Kinder (HAWIK-R)

    Testfrage: Was ist ein Thermometer?
    1 Punkt wird für jede Antwort gegeben, aus der hervorgeht, dass es sich um ein Messgerät zur Erfassung der Temperatur oder von Temperaturdifferenzen handelt. Ein treffendes Beispiel wird ebenfalls mit einem Punkt bewertet.


    Testfrage: Warum sollen kranke Kinder zuhause bleiben?
    Allgemein: Die Krankheit kann schneller auskuriert werden; kranke Kinder stellen eine Ansteckungsgefahr für andere Kinder dar; subjektives Krankheitsgefühl.
    1 Punkt: sie können andere Kinder anstecken ... sie fühlen sich krank und suchen Ruhe ... wenn sie nicht zu Hause bleiben, wird die Krankheit schlimmer.
    0 Punkte: weil man dann nicht spielen darf ... dann muss man in ein Krankenhaus ... man muss im Bett bleiben ... weil es dann nicht so schlimm ist.




  3. Interpretationsobjektivität

    Die Objektivität der Interpretation betrifft den Grad der Eindeutigkeit, mit der gleichen Testscores gleiche Merkmalsausprägungen zugeordnet werden. In der Regel geben die Testautoren Merkmalsausprägungen vor, die der Auswerter übernimmt. Die Objektivität der Interpretation ist hier zweifelsohne gegeben. Es stellt sich jedoch die Frage, ob dies mehr ist als eine Sprachregelung oder inwieweit eine solche Interpretation bei der Beantwortung der diagnostischen Fragestellung hilfreich ist. Des weiteren ist zu bedenken, dass bei diesem Vorgang eine Fülle diagnostischer Informationen verloren gehen.

    Der Grundintelligenztest CFT 1 bietet unter anderem folgende Interpretationshilfe an:

    IQ Bewertung
    66 und weniger
    67 bis 79
    80 bis 90
    91 bis 109
    110 bis 120
    121 bis 134
    über 135
    extrem niedrige Intelligenz (Schwachsinn
    sehr niedrige Intelligenz
    niedrige Intelligenz
    durchschnittliche Intelligenz
    hohe Intelligenz
    sehr hohe Intelligenz
    extrem hohe Intelligenz


weiter