In Prüfungsanalysen mit einer kleinen Anzahl Kandidatinnen und Kandidaten und/oder Items wird die Aussagekraft der psychometrischen Gütekriterien resp. der Kandidaten-Leistungen in der Interpretation zum Teil nicht ausreichend mitberücksichtigt. Mittels Bootsrapping∗ wird daher der Frage nachgegangen, ab welcher AnzahlKandidaten/Items die Gütekriterien/Leistungen als vertrauenswürdig gelten?
Zielsetzung
Die Ergebnisse sollen als Grundlage für die Diskussion dienen, ab welcher Anzahl Kandidaten/Items welche Interpretationen in Multiple-Choice-Examen zulässig sind.
Erste Ergebnisse
Präsentation anlässlich der GMA 2016 in Bern:
Hofer, Rainer; Huwendiek, Sören (16 September 2016). Psychometrische Gütekriterien von Multiple-Choice-Examen in Abhängigkeit der Anzahl Kandidaten und Items: Ab welchen Stichprobengrössen sind die Gütekriterien vertrauenswürdig? In: Jahrestagung GMA. Abstractband. Bern. 14.-17.09.2016. 10.3205/16gma175
∗Verweis Literatur: Efron B. Bootstrap methods: another look at the jackknife. Ann Statist. 1979;7:1
–26. DOI: 10.1214/aos/1176344552
Mitarbeitende
Rainer Hofer, David Sichau, Sören Huwendiek und weitere Mitarbeitende des IML