Estoy explorando las propiedades psicométricas de una medida de autoinforme de 10 ítems. Tengo alrededor de 400 casos en dos muestras independientes. Los elementos se completan en escalas Likert de 4 puntos. Un EFA claramente respalda una solución de un factor (por ejemplo, el primer valor propio sobre 6, todos los demás bajo 1) y el alfa de Cronbach es bueno (por ejemplo, .90). Ningún ítem tiene una baja correlación ítem-total.
Originalmente quería hacer un CFA (EFA fue solo un seguimiento después de ver que CFA no era bueno) probando un modelo de un factor. Para mi sorpresa, el ajuste para el modelo era relativamente pobre:
CFI=.91
TLI=.88
RMSEA=.13
Además, las cargas para cada uno de los artículos son bastante buenas (.65+).
Curiosamente, el SRMR=.05
, que es aceptable / bueno.
Los índices de modificación sugieren que correlaciono los errores en todo el lugar. Si hubiera una razón clara para hacerlo (por ejemplo, algunos de los elementos tienen una redacción muy similar), haría esto; sin embargo, todas las medidas están redactadas de manera similar, y correlacionar todos los términos de error sería extraño y doloroso.
Nunca he visto un caso como este. La medida es internamente consistente y está claramente compuesta por un factor en la EPT, pero exhibe un mal ajuste en el CFA. Los resultados son congruentes en ambas muestras independientes (de diferentes continentes). Probé un CFA de dos factores (5 elementos aleatorios agrupados) y el ajuste fue el mismo, o incluso marginalmente mejor.
Aquí están mis preguntas:
- ¿Por qué el ajuste según CFI / TLI / RMSEA es tan pobre dada la carga alfa / factor EFA / Cronbach?
- ¿Por qué es bueno el SRMR mientras que los otros índices no lo son? Sé que miden cosas diferentes, pero en mi experiencia, casi siempre convergen.
- ¿Debo correlacionar algunos de los errores?
Artículos de ejemplo:
- Tienes pensamientos sobre tus defectos
- Tienes pensamientos difíciles de olvidar.
- Piensas en la situación todo el tiempo.