Análisis factorial de comprensión

8

¿Puedo entender el análisis factorial de la siguiente manera?

Supongamos que tengo 5 variables independientes (A, B, C, D, E)

El análisis factorial me permite hacer que (D, E) sean variables dependientes y me permiten hacer que sean combinaciones lineales de (A, B, C).

Por lo tanto, solo necesitaré transportar datos (A, B, C) y la matriz , luego puedo recrear datos (D, E) por datos (A, B, C) y la matriz . $\Lambda$ $\Lambda$

Solo hace la reducción de datos. Estoy en lo cierto?

factor-analysis

— Marco
fuente

55

Voté esta pregunta porque es razonable. Las preguntas bien formuladas que exponen malentendidos deben ser bienvenidas (y votadas para indicar eso), no menospreciadas con votos negativos, ya que pueden generar excelentes respuestas como la que @StasK ya ha ofrecido aquí.

— whuber

18

No. En el análisis factorial, todas las variables son variables dependientes y dependen de factores latentes (y también contienen errores de medición). Si bien los puntajes de los factores a menudo se usan en lugar de las variables originales, lo que puede parecer un problema de reducción de datos, esto es precisamente a lo que apunta el análisis de factores. En otras palabras, en lugar de decir: "Guau, tengo muchos datos que realmente no puedo procesar y entender; ¿puedo encontrar un truco para tener menos variables?", El análisis factorial generalmente se realiza en la situación " No puedo medir una cosa directamente, así que intentaré diferentes enfoques; sé que tendré muchos datos, pero estos serían datos relacionados de estructura conocida, y podré explotar esa estructura para aprender sobre esa cosa. que no pude medir directamente ".

Lo que describió califica como regresión multivariada (no confunda con regresión múltiple, que abarca una variable dependiente y muchas variables explicativas; la regresión multivariada tiene muchas variables dependientes y el mismo conjunto de variables explicativas en cada regresión individual), o correlaciones canónicas ( aunque con un poco de imaginación), o un modelo de ecuaciones estructurales de múltiples indicadores y causas múltiples, puede ser. Pero no, este no es un análisis factorial.

— StasK
fuente

1

para agregar a la excelente respuesta de @ StasK, aclararé más al decir que este problema cae dentro del paraguas general del modelado de ecuaciones estructurales (SEM). SEM es una técnica que puede emplearse para modelar estructuras de covarianza y, aunque generalmente se usa con variables no observadas o latentes, también se puede aplicar a modelos con solo variables observadas o manifiestas. aplicando la metodología y la terminología SEM a su problema, D y E se considerarían variables endógenas, mientras que A, B y C son variables exógenas. la endogenia sugiere que la varianza en la variable particular se explica por otra variable, mientras que la exogenia sugiere que la varianza no se explica por otra variable, latente o manifiesta.

werner wothke proporciona algunas buenas diapositivas que presentan SEM usando SAS aquí .

También busque el sitio de ed rigdon que discuta una variedad de temas SEM (¡demasiado nuevo, no se puede vincular!).

volviendo a lo básico, si su objetivo es comprender el análisis factorial, sugeriría comenzar con un texto aplicado como el análisis factorial confirmatorio de brown para la investigación aplicada .

— allinonemove
fuente

1

La página de Ed Rigdon es www2.gsu.edu/~mkteer . Para hacer esta respuesta aún más completa, agregaría que el SEM con variables observadas solo se estudió por primera vez en econometría en la década de 1950 más o menos bajo el título de modelos de ecuaciones simultáneas. El excelente libro de Ken Bollen ( amazon.com/Structural-Equations-Latent-Variables-Kenneth/dp/… ) es en realidad uno de los pocos libros sobre SEM que lo cubre con suficiente detalle para aprender algo útil.

— StasK