PREGUNTA:
Tengo datos binarios en las preguntas del examen (correcto / incorrecto). Algunas personas podrían haber tenido acceso previo a un subconjunto de preguntas y sus respuestas correctas. No sé quién, cuántos o cuáles. Si no hubiera trampa, suponga que modelaría la probabilidad de una respuesta correcta para el ítem como , donde representa la dificultad de la pregunta es la capacidad latente del individuo. Este es un modelo de respuesta de ítem muy simple que se puede estimar con funciones como ltm's rasch () en R. Además de las estimaciones (donde indexa individuos) de la variable latente, tengo acceso a estimaciones separadasβ i z z j j q j de la misma variable latente que se derivaron de otro conjunto de datos en el que no era posible hacer trampa.
El objetivo es identificar a las personas que probablemente hicieron trampa y los artículos que engañaron. ¿Cuáles son algunos enfoques que podría tomar? Además de los datos sin procesar, , y están disponibles, aunque los dos primeros tendrán algún sesgo debido a trampas. Idealmente, la solución vendría en forma de agrupación / clasificación probabilística, aunque esto no es necesario. Las ideas prácticas son muy bienvenidas, al igual que los enfoques formales. z j q j
Hasta ahora, he comparado la correlación de puntajes de preguntas para pares de individuos con puntajes más altos vs. más bajos (donde es un índice aproximado de la probabilidad de que hicieron trampa). Por ejemplo, clasifiqué a los individuos por y luego tracé la correlación de pares sucesivos de puntajes de preguntas de los individuos. También intenté trazar la correlación media de puntajes para individuos cuyos valores eran mayores que el cuantil de , en función de . No hay patrones obvios para ninguno de los enfoques. q j - z j q j - z j q j - z jnth q j - z jn
ACTUALIZAR:
Terminé combinando ideas de @SheldonCooper y el útil documento de Freakonomics que @whuber me señaló. Otras ideas / comentarios / críticas son bienvenidas.
Deje que sea el puntaje binario de la persona en la pregunta . Estime el modelo de respuesta del elemento donde es el parámetro de facilidad del elemento y es una variable de habilidad latente. (Se puede sustituir un modelo más complicado; I estoy usando un 2PL en mi aplicación). Como mencioné en mi publicación original, tengo estimaciones de la variable de habilidad de un conjunto de datos separado (diferentes elementos, mismas personas) en qué trampa no fue posible. Específicamente, son estimaciones empíricas de Bayes del mismo modelo de respuesta al artículo anterior. j i l o g i t ( P r ( X i j = 1 | z j ) = β i + z j , β i z j ^ q j { y i j } ^ q j
La probabilidad de la puntuación observada , condicional a la facilidad del elemento y la capacidad de la persona, se puede escribir donde es la probabilidad predicha de una respuesta correcta, e es el logit inverso. Entonces, condicional a las características del elemento y la persona, la probabilidad conjunta de que la persona tenga las observaciones es y de manera similar, la probabilidad conjunta de que el elemento tenga las observaciones p i j = P r ( X i j = x i j | ^ β i , ^ q j ) = P i j ( ^ β i , ^ q j ) x i j ( 1 - P i j ( ^ β i , ^ q j ) ) 1 - x
Un paso adicional que intenté es tomar r% de las personas menos probables (es decir, personas con el r% más bajo de valores de p_j ordenados), calcular la distancia media entre sus puntajes observados x_j (que debería correlacionarse con personas con r baja, que son posibles tramposos), y graficarlo para r = 0.001, 0.002, ..., 1.000. La distancia media aumenta para r = 0.001 a r = 0.025, alcanza un máximo y luego disminuye lentamente a un mínimo en r = 1. No es exactamente lo que esperaba.