Quiero reducir la dimensionalidad de los sistemas de orden superior y capturar la mayor parte de la covarianza en un campo preferiblemente bidimensional o unidimensional. Entiendo que esto se puede hacer a través del análisis de componentes principales, y he usado PCA en muchos escenarios. Sin embargo, nunca lo he usado con tipos de datos booleanos, y me preguntaba si es significativo hacer PCA con este conjunto. Entonces, por ejemplo, imagine que tengo métricas cualitativas o descriptivas, y asigno un "1" si esa métrica es válida para esa dimensión, y un "0" si no lo es (datos binarios). Entonces, por ejemplo, imagina que estás tratando de comparar a los Siete Enanitos en Blancanieves. Tenemos:
Doc, Dopey, Bashful, Grumpy, Sneezy, Sleepy and Happy, y desea organizarlos en función de sus cualidades, y lo hizo así:
Entonces, por ejemplo, Bashful es intolerante a la lactosa y no está en la lista de honor A. Esta es una matriz puramente hipotética, y mi matriz real tendrá muchas más columnas descriptivas. Mi pregunta es, ¿sería apropiado hacer PCA en esta matriz como un medio para encontrar la similitud entre los individuos?
a means of finding the similarity between individuals
. Pero esta tarea es para un análisis de Cluster, no para PCA.