Para realizar el análisis de componentes principales (PCA), debe restar las medias de cada columna de los datos, calcular la matriz de coeficientes de correlación y luego encontrar los vectores propios y los valores propios. Bueno, más bien, esto es lo que hice para implementarlo en Python, excepto que solo funciona con matrices pequeñas porque el método para encontrar la matriz de coeficientes de correlación (corrcoef) no me permite usar una matriz con alta dimensionalidad. Como tengo que usarlo para imágenes, mi implementación actual realmente no me ayuda.
He leído que es posible tomar su matriz de datos y calcular lugar de , pero eso no funciona para mí. Bueno, no estoy exactamente seguro de entender lo que significa, además del hecho de que se supone que es una matriz lugar de (en mi caso ). Leí sobre aquellos en los tutoriales de caras propias, pero ninguno de ellos parecía explicarlo de tal manera que realmente pudiera entenderlo.D D ⊤ / n D ⊤ D / n n × n p × p p ≫ n
En resumen, ¿hay una descripción algorítmica simple de este método para que pueda seguirlo?