El algoritmo PCA se puede formular en términos de la matriz de correlación (suponga que los datos ya se han normalizado y solo estamos considerando la proyección en la primera PC). La función objetivo se puede escribir como:
Esto está bien, y usamos multiplicadores lagrangianos para resolverlo, es decir, reescribirlo como:
que es equivalente a
y por lo tanto ( ver aquí en Mathworld ) parece ser igual a
Pero esto es para maximizar la distancia entre el punto y la línea, y por lo que he leído aquí , esto es incorrecto: debería ser , no . ¿Dónde está mi error?
O, ¿alguien puede mostrarme el vínculo entre maximizar la varianza en el espacio proyectado y minimizar la distancia entre el punto y la línea?