Estoy leyendo este artículo sobre la diferencia entre el Análisis de componentes principales y el Análisis discriminante múltiple (Análisis discriminante lineal), y estoy tratando de entender por qué alguna vez usaría PCA en lugar de MDA / LDA.
La explicación se resume de la siguiente manera:
en términos generales, en PCA estamos tratando de encontrar los ejes con variaciones máximas donde los datos están más dispersos (dentro de una clase, ya que PCA trata todo el conjunto de datos como una clase), y en MDA estamos maximizando adicionalmente la distribución entre clases.
¿No siempre querría maximizar la varianza y maximizar la propagación entre clases?