Aunque una PCA aplicada a datos binarios arrojaría resultados comparables a los obtenidos de un Análisis de Correspondencia Múltiple (los puntajes factoriales y los valores propios están relacionados linealmente), existen técnicas más apropiadas para tratar tipos de datos mixtos, a saber, el Análisis Factorial Múltiple para datos mixtos disponibles en el paquete FactoMineR R ( AFDM()
). Si sus variables pueden considerarse como subconjuntos estructurados de atributos descriptivos, entonces el Análisis Factorial Múltiple ( MFA()
) también es una opción.
El desafío con las variables categóricas es encontrar una forma adecuada de representar distancias entre categorías de variables e individuos en el espacio factorial. Para superar este problema, puede buscar una transformación no lineal de cada variable, ya sea nominal, ordinal, polinomial o numérica, con una escala óptima. Esto está bien explicado en Métodos Gifi para el Escalado Óptimo en R: Los homals del paquete , y una implementación está disponible en los homals del paquete R correspondiente .