Si entiendo correctamente, un análisis discriminante lineal (LDA) asume datos distribuidos normales, características independientes y covarianzas idénticas para cada clase para el criterio de optimización.
Dado que la media y la varianza se estiman a partir de los datos de entrenamiento, ¿no es ya una violación?
Encontré una cita en un artículo (Li, Tao, Shenghuo Zhu y Mitsunori Ogihara. " Uso del análisis discriminante para la clasificación de varias clases: una investigación experimental ". Sistemas de conocimiento e información 10, nº 4 (2006): 453–72 .)
"el análisis discriminante lineal con frecuencia logra buenos desempeños en las tareas de reconocimiento de rostros y objetos, a pesar de que los supuestos de la matriz de covarianza común entre los grupos y la normalidad a menudo se violan (Duda, et al., 2001)"
- desafortunadamente, no pude encontrar la sección correspondiente en Duda et. Alabama. "Clasificación de patrones".
¿Alguna experiencia o pensamiento sobre el uso de LDA (vs. LDA regularizada o QDA) para datos no normales en el contexto de la reducción de dimensionalidad?