Antecedentes: le pregunté a cientos de participantes en mi encuesta cuánto están interesados en áreas seleccionadas (en escalas Likert de cinco puntos con 1 que indica "no interesado" y 5 que indica "interesado").
Entonces probé PCA. La siguiente imagen es una proyección de los dos primeros componentes principales. Los colores se utilizan para los géneros y las flechas de PCA son variables originales (es decir, intereses).
Me di cuenta que:
- Los puntos (encuestados) están bastante bien separados por el segundo componente.
- No quedan puntas de flecha.
- Algunas flechas son mucho más cortas que otras.
- Las variables tienden a formar grupos, pero no las observaciones.
- Parece que las flechas que apuntan hacia abajo (a los hombres) son principalmente los intereses de los hombres y las flechas que apuntan hacia arriba son principalmente los intereses de las mujeres.
- Algunas flechas no apuntan hacia abajo ni hacia arriba.
Preguntas: ¿Cómo interpretar correctamente las relaciones entre puntos (encuestados), colores (géneros) y flechas (variables)? ¿Qué otras conclusiones sobre los encuestados y sus intereses se pueden extraer de esta trama?
Los datos se pueden encontrar aquí .