Adaptives Testen

Adaptives Testen unterscheidet sich von herkömmlichen Testmethoden dadurch, dass nicht allen Testteilnehmenden dieselben Aufgaben in fester Reihenfolge gestellt werden. Stattdessen passt sich der Test dynamisch an die individuelle Leistung der Testperson an, indem Aufgaben aus einem umfangreichen Pool (Itempool) ausgewählt werden. Ziel ist es, nur diejenigen Aufgaben zu präsentieren, die aussagekräftige Informationen über die spezifischen Fähigkeiten der Testperson liefern, sogenannte informative Aufgaben. Die Chance zur Lösung dieser Aufgaben liegt bei 50 %. Dabei bekommen Testpersonen mit einer hohen Merkmalsausprägung (z. B. Intelligenz) schwierigere Items vorgelegt als Testpersonen mit einer niedrigeren Merkmalsausprägung. Adaptive Tests werden wegen des eingesetzten adaptiven Algorithmus Computer-basiert durchgeführt.

Die Umsetzung des adaptiven Testens erfordert mehrere Komponenten:

Itempool: Vor Testbeginn muss eine umfassende Kalibrierung der Testitems erfolgen, wobei der Pool deutlich mehr Items enthalten muss, als in der vorgesehenen Testzeit bearbeitet werden können.
Testbeginn: Der Test startet entweder mit einer Aufgabe mittlerer Schwierigkeit oder mit einer leichten „Eisbrecheraufgabe“. Bei Vorliegen von Vorinformationen über die Testperson können diese in die Auswahl des ersten Items einfließen.
Schätzung der Merkmalsausprägung: Während des Tests erfolgt eine vorläufige Schätzung der Merkmalsausprägung der Testperson. Diese Schätzung dient zur Auswahl der nächsten Aufgabe bzw. Aufgabengruppe.
Itemauswahl während der Testung: Es kann zwischen zwei Methoden gewählt werden:

a. Tailored Testing: Nach jeder beantworteten Aufgabe wird die Auswahl des nächsten Items angepasst. Das ist die flexibelste Art des adaptiven Testens. Nachteil ist aber, dass Testteilnehmenden, anders als in gewohnten Testsituationen, nicht zwischen Aufgaben vor- und zurückspringen können.

b. Branched Testing: Hier besteht der Test aus mehreren Stufen, die wiederum aus mehreren – unterschiedlich schweren – Aufgabengruppen bestehen. In der ersten Stufe erhalten die Teilnehmenden eine mittelschwere Aufgabengruppe und werden dann in eine zu ihrem Schwierigkeitsniveau passende Aufgabengruppe geleitet. Die maximale Bearbeitungszeit und Anzahl an Aufgaben ist somit vorgegeben, was die Augenscheinvalidität erhöht. Dieses Vorgehen verbindet die Vorteile des klassischen mit denen des adaptiven Testens.

Berücksichtigung nicht-statistischer Einschränkungen: Das Testverfahren muss auch nicht-statistische Faktoren berücksichtigen, die kontextabhängig sein können. So wird beispielsweise auch dafür Sorge getragen, dass alle zu messenden Dimensionen des Merkmals ausreichend abgedeckt werden (z. B. verbale Dimension eines Intelligenztests).
Kriterien zur Beendigung der Testung: Der Test endet, wenn eine bestimmte Anzahl von Items bearbeitet wurde, der Standardfehler der Personenparameterschätzung klein genug ist oder eine maximale Bearbeitungszeit erreicht wurde.

Für die Ermittlung des Testwerts ist – anders als beim klassischen Testen – die Anzahl gelöster Aufgaben allein nicht aussagekräftig, da die Testpersonen unterschiedlich schwere Aufgaben bearbeiten. Stattdessen wird die tatsächliche, aber unbekannte Merkmalsausprägung der Person über eine Modellgleichung und unter Berücksichtigung der gelösten Aufgaben und deren Schwierigkeiten geschätzt, wobei Modelle der Item-Response-Theorie zum Einsatz kommen.

Der Hauptvorteil des adaptiven Testens liegt in der gesteigerten Messeffizienz, also einer kürzere Bearbeitungszeit für die Teilnehmenden. Zusätzlich ermöglicht das adaptive Testen eine hohe Testsicherheit, da viele unterschiedliche Testzusammenstellungen zum Einsatz kommen. Nachteile sind der hohe Entwicklungsaufwand und die Notwendigkeit eines Systems, welches adaptive Tests durchführen kann.