A diferencia del análisis de componentes principales, las soluciones para los modelos de análisis factorial no están necesariamente anidadas. Es decir, las cargas (por ejemplo) para el primer factor no serán necesariamente idénticas cuando solo se extrae el primer factor frente a cuando lo son los dos primeros factores.
Con eso en mente, considere un caso en el que tenga un conjunto de variables manifiestas que estén altamente correlacionadas y (por el conocimiento teórico de su contenido) deba estar impulsado por un solo factor. Imagine que los análisis factoriales exploratorios (según la métrica que prefiera: análisis paralelo, diagrama de pantalla, valores propios> 1, etc.) sugieren fuertemente que hay factores: un factor primario grande y un factor secundario pequeño. Está interesado en utilizar las variables de manifiesto y la solución de factores para estimar (es decir, obtener puntajes de factores) los valores de los participantes para el primer factor. En este escenario, sería mejor:
- Ajuste un modelo de factor para extraer solo factor y obtenga puntajes de factor (etc.), o
- ajustar un modelo de factores para extraer ambos factores, obtener puntajes de factores para los factores, pero descartar / ignorar los puntajes del segundo factor?
Para cualquiera que sea la mejor práctica, ¿por qué? ¿Hay alguna investigación sobre este tema?
Is is always better to extract more factors when they exist?
no está muy claro. Siempre es mejor extraer tantos como existan. La falta de ajuste o el exceso de ajuste distorsionan la estructura latente "verdadera" debido a la naturaleza multivariada y no anidada del análisis mencionado por usted. El problema es que no sabemos exactamente cuántos factores hay en nuestros datos. Y si estos datos tienen tantos como la población tiene.