Teoría de respuesta al ítem versus análisis factorial confirmatorio


14

Me preguntaba cuáles son las diferencias centrales y significativas entre la teoría de respuesta al ítem y el análisis factorial confirmatorio.

Entiendo que hay diferencias en los cálculos (centrándose más en el elemento frente a las covarianzas; log-lineal frente a lineal).

Sin embargo, no tengo idea de lo que esto significa desde una perspectiva de nivel superior: ¿significa esto que IRT es mejor que CFA en algunas circunstancias? ¿O para fines finales ligeramente diferentes?

Cualquier reflexión sería útil ya que un análisis de la literatura de investigación condujo a una descripción más de IRT y CFA que cualquier comparación útil de las diferencias centrales entre ellos.

Respuestas:


7

La respuesta de @Philchalmers es acertada, y si quieres una referencia de uno de los líderes en el campo, Muthen (creador de Mplus), aquí tienes: (Editado para incluir una cita directa)

Un usuario de MPlus pregunta: Estoy tratando de describir e ilustrar las similitudes y diferencias actuales entre CFA binario e IRT para mi tesis. El método de estimación predeterminado en Mplus para CFA categórico es WLSMV. Para ejecutar un modelo IRT, el ejemplo en su manual sugiere utilizar MLR como método de estimación. Cuando uso MLR, ¿la entrada de datos sigue siendo la matriz de correlación tetracórica o se usa la matriz de datos de respuesta original?

Bengt Muthen responde: No creo que haya una diferencia entre CFA de variables categóricas e IRT. A veces se reclama pero no estoy de acuerdo. El estimador que se usa típicamente puede diferir, pero eso no es esencial. MLR utiliza los datos en bruto, no una matriz de correlación tetracórica de muestra. ... El enfoque ML (R) es el mismo que el enfoque "ML marginal (MML)" descrito en, por ejemplo, el trabajo de Bock. Entonces, utilizando los datos sin procesar e integrando los factores utilizando la integración numérica. MML en contraste con "ML condicional" utilizado, por ejemplo, con enfoques Rasch.

Suponiendo factores normales, relaciones probit (ojiva normal) factor-factor e independencia condicional, los supuestos son los mismos para ML y para WLSMV, donde este último usa tetracóricos. Esto se debe a que esos supuestos corresponden a suponer variables de respuesta latente continua subyacente normal multivariante detrás de los resultados categóricos. Entonces, WLSMV solo usa información de primer y segundo orden, mientras que ML llega hasta el orden más alto. Sin embargo, la pérdida de información parece pequeña. ML no se ajusta al modelo de estas muestras tetracóricas, por lo que tal vez se pueda decir que WLSMV margina de una manera diferente. Se trata de diferencias de estimador en lugar de diferencias de modelo.

Tenemos una nota IRT en nuestro sitio web:

http://www.statmodel.com/download/MplusIRT2.pdf

pero de nuevo, el enfoque ML (R) no es nada diferente de lo que se usa en IRT MML.

Fuente: http://www.statmodel.com/discussion/messages/9/10401.html?1347474605


2
¿Podrías copiar y pegar algunas citas relevantes de Muthen en tu respuesta? Las respuestas de solo enlace generalmente están mal vistas, en particular porque los enlaces tienden a pudrirse.
ameba dice Reinstate Monica

2
No estoy seguro de estar de acuerdo con la declaración de Muthen aquí, ya que parece estar definiendo IRT de una manera muy limitada. Sí, los modelos 2PL y de respuesta graduada se pueden entender en un marco SEM porque tienen buenas funciones de vinculación canónica y, por lo tanto, se pueden reexpresar utilizando otras estadísticas suficientes (como correlaciones policóricas). Pero, ¿qué hay de otros modelos IRT más comunes, como el modelo 3PL, modelo de punto ideal, modelo parcialmente compensatorio, etc.? Claro, algunos modelos se pueden entender en un marco SEM, pero creo que mi punto sobre IRT sigue en pie.
philchalmers

17

De alguna manera tiene razón, CFA e IRT se cortan de la misma tela. Pero en muchos sentidos también son bastante diferentes. CFA, o más apropiadamente el ítem CFA, es una adaptación del marco de modelación de ecuaciones estructurales / covarianza para dar cuenta de un tipo específico de covarianza entre ítems categóricos. IRT trata más directamente sobre el modelado de relaciones de variables categóricas sin usar solo información de primer y segundo orden en las variables (es información completa, por lo que sus requisitos generalmente no son tan estrictos).

El artículo CFA tiene varios beneficios, ya que se encuentra dentro del marco SEM y, por lo tanto, tiene una aplicación muy amplia para sistemas multivariados de relaciones con otras variables. IRT, por otro lado, se centra principalmente en la prueba en sí, aunque las covariables también se pueden incluir en la prueba directamente (por ejemplo, ver temas sobre IRT explicativo). También descubrí que las relaciones de modelado de elementos son mucho más generales en el marco de IRT en que los modelos de respuesta a elementos no monotónicos, no paramétricos o simplemente personalizados son más fáciles de manejar porque no hay que preocuparse por la suficiencia de usar la matriz de correlación policórica.

Ambos marcos tienen sus pros y sus contras, pero en general el CFA es más flexible cuando el nivel de abstracción / inferencia de modelado se enfoca en la relación dentro de un sistema de variables, mientras que IRT generalmente se prefiere si la prueba en sí (y los elementos en ella) son El foco de interés.


Maravilloso: esta es una descripción encantadora y clara. Gracias Phil
SimonsSchus

2
Esta debería ser la respuesta aceptada.
Vladislavs Dovgalecs

2

Creo que Yves Rosseel lo analiza brevemente en las diapositivas 91-93 de su taller de 2014: http://www.personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf

Tomado de Rosseel (2014, enlace de arriba):

Enfoque de información completa: probabilidad máxima marginal

orígenes: modelos IRT (por ejemplo, Bock y Lieberman, 1970) y GLMM

...

la conexión con IRT

• la relación teórica entre SEM e IRT ha sido bien documentada:

Takane, Y., y De Leeuw, J. (1987). Sobre la relación entre la teoría de respuesta al ítem y el análisis factorial de variables discretizadas. Psychometrika, 52, 393-408.

Kamata, A. y Bauer, DJ (2008). Una nota sobre la relación entre el análisis de factores y los modelos de teoría de respuesta al ítem Modelización de ecuaciones estructurales, 15, 136-153.

Joreskog, KG y Moustaki, I. (2001). Análisis factorial de variables ordinales: una comparación de tres enfoques. Investigación conductual multivariante, 36, 347-387.

cuando son equivalentes?

• probit (normal-ogive) versus logit: ambas métricas se usan en la práctica

• un CFA de factor único en elementos binarios es equivalente a un modelo IRT de 2 parámetros (Birnbaum, 1968):

En CFA: ... En IRT: ... (ver diapositiva)

• un CFA de factor único en ítems policotómicos (ordinales) es equivalente al modelo de respuesta graduada (Samejima, 1969)

• no hay equivalente CFA para el modelo de 3 parámetros (con un parámetro de adivinanzas)

• el modelo Rasch es equivalente a un CFA de factor único en elementos binarios, pero donde todas las cargas de factores están limitadas a ser iguales (y la métrica probit se convierte en una métrica logit)

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.