Estaba jugando con los métodos PCA y LDA y estoy atascado en un punto, tengo la sensación de que es tan simple que no puedo verlo.
Las matrices de dispersión dentro de clase ( ) y entre clases ( ) se definen como:
La matriz de dispersión total se da como:
donde C es el número de clases y N es el número de muestras son muestras, μ i es la media de la clase, μ es la media general.
Mientras intentaba obtener , llegué a un punto en el que tenía:
como un término Esto debe ser cero, pero ¿por qué?
En efecto:
2
La respuesta es que estás sumando las desviaciones de los valores alrededor de su media y esa suma es cero. Pero, ¿qué son, precisamente, , m y m i ? ¿Cómo son m y estoy i relacionado con mu y mu i ? La calidad de las respuestas dependerá de la precisión con la que adivinemos, ¡pero nos está obligando a hacer muchas conjeturas!
—
whuber
@whuber: You are totally right, I revised my question.
—
nimcap