Kennedy Quaigrain e Ato Kwarmina Arhin (2017) fanno uso degli indici della CTT per valutare un questionario a risposta chiusa composto da 50 domande da svolgere in 65 minuti somministrato a 247 studenti in un corso post-laurea in Educazione presso il Politecnico di Cape Coast in Ghana. La prova in questione è l’esame di 0ne semestre proprio in un corso dedicato alla valutazione in ambito educativo (Educational Measurement course). Le domande presentavano 4 opzioni di risposta di cui soltanto una corretta; come da standard, alla domanda corretta è stato assegnato un punto e alle risposte errate 0. Pertanto i punteggi conseguibili dagli studenti variavano fra 0 e 50. Gli autori valutano il test attraverso indici di dif0coltà, discriminatività, la formula KuderRichardson (KR-20) con un focus sulla qualità degli item e l’ef0cacia dei distrattori.
Calcolano la DV come rapporto fra numero di risposte corrette e numero di risposte date, considerando eccellenti quelle con un punteggio compreso fra 0,4 e 0,6. Per la DI lavorano sugli estremi al 27%, sottraggono il numero di risposte corrette dal gruppo con i punteggi più bassi dal gruppo dei “migliori”, normalizzando (dividono cioè per il numero totale dei partecipanti). Usano come valori di riferimento per la discriminatività i range riportati sopra da Ebel e Frisbie (1991).
La mediana dei punteggi dei partecipanti è pari a 30 con una differenza inter-quartile pari a 9; i valori di asimmetria e curtosi per i punteggi sono considerati accettabili; allo stesso modo è adeguato l’indice KR-20 pari a 0,77.
La maggior parte degli item ha livelli di dif0coltà accettabili (compresi fra 20% e 90%). L’indice di discriminatività assume valori fra -0,22 e 0,46. Diciotto dei 50 item del questionario hanno un indice di discriminatività superiore allo 0,3 e pertanto accettabile. Al contrario 20 item, proprio in virtù del loro indice di discriminatività, necessitano di una revisione completa.
La Figura 8.7 plotta indici di dif0coltà (ascisse) e di discriminatività (ordinate) degli item della prova. Vediamo gra0camente che item molto dif0cili (DV < 0,20) hanno un indice di discriminatività negativo: le risposte corrette a questi item non permettono di discriminare soggetti che hanno sviluppato conoscenze sugli argomenti del corso rispetto a quanti non l’hanno fatto. Gli item con dif0coltà compresa fra 0,50 e 0,70 (range più ef0cace) hanno i valori di discriminatività più alti. La discriminatività tende a diminuire per gli item più facili, dove la maggior parte degli studenti risponde correttamente senza, di conseguenza, garantire che l’esattezza delle risposte sia sintomo di una “buona preparazione” sui temi del corso.