La respuesta de @ Tom es excelente, pero me gustaría ofrecer una versión que sea más heurística y que introduzca un concepto adicional.
Regresión logística
Imagina que tenemos una serie de preguntas binarias. Si estamos interesados en la probabilidad de responder sí a cualquiera de las preguntas, y si estamos interesados en el efecto de algunas variables independientes en esa probabilidad, usamos regresión logística:
PAGS(yyo= 1 ) =11 + e x p ( Xβ)= l o gyot-1 ( Xβ)
donde indizo las preguntas (es decir, los ítems), X es un vector de características de los encuestados, y β es el efecto de cada una de esas características en términos de probabilidades de registro.
IRT
Ahora, tenga en cuenta que dije que teníamos varias preguntas binarias. Esas preguntas podrían llegar a algún tipo de rasgo latente, por ejemplo, capacidad verbal, nivel de depresión, nivel de extraversión. A menudo, estamos interesados en el nivel del rasgo latente en sí.
Por ejemplo, en el Examen de registro de posgrado, estamos interesados en caracterizar la habilidad verbal y matemática de varios solicitantes. Queremos una buena medida de su puntaje. Obviamente, podríamos contar cuántas preguntas alguien respondió correctamente, pero eso trata todas las preguntas como si valieran la misma cantidad: no explica explícitamente el hecho de que las preguntas pueden variar en dificultad. La solución es la teoría de respuesta al ítem. Nuevamente, (por ahora) no estamos interesados en X oβ, pero solo estamos interesados en la capacidad verbal de la persona, que llamaremos θ. Utilizamos el patrón de respuestas de cada persona para todas las preguntas para estimarθ:
PAGS(yyo= 1 ) = l o gyot-1 [unayo(θj-siyo) ]
dónde unayoes la discriminación del elemento i ysiyo es su dificultad
Entonces, esa es una distinción obvia entre la regresión logística regular y la IRT. En el primero, estamos interesados en los efectos de las variables independientes en una variable dependiente binaria. En este último, usamos un montón de variables binarias (o categóricas) para predecir algún rasgo latente. La publicación original decía queθEs nuestra variable independiente. Respetuosamente no estoy de acuerdo, creo que es más como esta es la variable dependiente en IRT.
Utilicé elementos binarios y regresión logística por simplicidad, pero el enfoque generaliza los elementos ordenados y la regresión logística ordenada.
IRT explicativo
Sin embargo, ¿qué pasaría si estuviera interesado en las cosas que predicen el rasgo latente, es decir, las X syβs mencionado anteriormente?
Como se mencionó anteriormente, un modelo para estimar el rasgo latente es simplemente contar el número de respuestas correctas o sumar todos los valores de sus elementos Likert (es decir, categóricos). Eso tiene sus defectos; está asumiendo que cada elemento (o cada nivel de cada elemento) vale la misma cantidad del rasgo latente. Este enfoque es bastante común en muchos campos.
Quizás pueda ver a dónde voy con esto: puede usar IRT para predecir el nivel del rasgo latente, luego realizar una regresión lineal regular. Sin embargo, eso ignoraría la incertidumbre en el rasgo latente de cada persona.
Un enfoque más basado en principios sería utilizar IRT explicativo: usted estima simultáneamente θutilizando un modelo IRT y calcula el efecto de sus X s enθcomo si estuvieras usando regresión lineal. Incluso puede ampliar este enfoque para incluir efectos aleatorios para representar, por ejemplo, el hecho de que los estudiantes están anidados en las escuelas.
Más lecturas disponibles en la excelente introducción de Phil Chalmers a su mirt
paquete. Si comprende los aspectos básicos de IRT, iría a la sección IRT de efectos mixtos de estas diapositivas . Stata también es capaz de ajustar modelos IRT explicativos (aunque creo que no puede ajustarse a modelos IRT explicativos de efectos aleatorios como describí anteriormente).