Aquí hay una gama sorprendentemente amplia de los índices de copia de respuestas, aunque con poca discusión sobre sus méritos: http://www.bjournal.co.uk/paper/BJASS_01_01_06.pdf .
Hay un campo de psicología (educativa) llamado teoría de respuesta al ítem (IRT) que proporciona el fondo estadístico para preguntas como estas. Si usted es estadounidense y realizó un SAT, ACT o GRE, se enfrentó a una prueba desarrollada teniendo en cuenta IRT. El postulado básico de IRT es que cada estudiantei se caracteriza por su habilidad ai; cada pregunta se caracteriza por su dificultadbj; y la probabilidad de responder una pregunta correctamente es
π(ai,bj;c)=Prob[student i answers question j correctly]=Φ(c(ai−bj))
dónde
Φ(z) es el cdf del estándar normal, y
c es un parámetro adicional de sensibilidad / discriminación (a veces, se hace para preguntas específicas,
cj, si hay suficiente información, es decir, suficientes examinados, para identificar las diferencias). Una suposición oculta aquí que da a los estudiantes la habilidad
i, las respuestas a diferentes preguntas son independientes. Esta suposición se viola si tiene una batería de preguntas sobre decir el mismo párrafo de texto, pero resumamos por un minuto.
Para las preguntas "Sí / No", este puede ser el final de la historia. Para más de dos preguntas de categoría, podemos hacer una suposición adicional de que todas las elecciones incorrectas son igualmente probables; por una preguntaj con kj elecciones, la probabilidad de cada elección incorrecta es π′(ai,bj;c)=[1−π(ai,bj;c)]/(kj−1).
Para estudiantes de habilidades. ai y ak, la probabilidad de que coincidan en sus respuestas para una pregunta con dificultad bj es
ψ(ai,ak;bj,c)=π(ai,bj;c)π(ak,bj;c)+(k−1)π′(ai,bj;c)π′(ak,bj;c)
Si lo desea, puede dividir esto en probabilidad de que coincida con la respuesta correcta,
ψc(ai,ak;bj,c)=π(ai,bj;c)π(ak,bj;c), y la probabilidad de coincidir con una respuesta incorrecta,
ψi(ai,ak;bj,c)=(k−1)π′(ai,bj;c)π′(ak,bj;c), aunque desde el marco conceptual de IRT, esta distinción no es material.
Ahora, puede calcular la probabilidad de coincidencia, pero probablemente será combinatoriamente minúscula. Una mejor medida puede ser la relación de la información en el patrón de respuestas en pares,
I(i,k)=∑j1{matchj}lnψ(ai,ak;bj,c)+1{non-matchj}ln[1−ψ(ai,ak;bj,c)]
y relacionarlo con la entropía
E(i,k)=E[I(i,k)]=∑jψ(ai,ak;bj,c)lnψ(ai,ak;bj,c)+(1−ψ(ai,ak;bj,c))ln[1−ψ(ai,ak;bj,c)]
Puede hacer esto para todos los pares de estudiantes, trazarlos o clasificarlos, e investigar las mayores proporciones de información a entropía.
Los parámetros de la prueba {c,bj,j=1,2,…} y habilidades estudiantiles {ai}no caerán del cielo azul, pero son fácilmente estimables en software moderno como R con
lme4
o paquetes similares:
irt <- glmer( answer ~ 1 + (1|student) + (1|question), family = binomial)
o algo muy parecido a esto.