¿Cuál es la razón, si la hay, para usar el Análisis discriminante (DA) en los resultados de un algoritmo de agrupamiento como k-means, como lo veo de vez en cuando en la literatura (esencialmente sobre el subtipo clínico de los trastornos mentales)?
Por lo general, no se recomienda probar las diferencias de grupo en las variables que se usaron durante la construcción del conglomerado, ya que apoyan la maximización (minimización de la respiración) de la inercia entre clases (resp. Dentro de la clase). Por lo tanto, no estoy seguro de apreciar completamente el valor agregado del DA predictivo, a menos que intentemos integrar a los individuos en un espacio factorial de menor dimensión y tener una idea de la "generalización" de tal partición. Pero incluso en este caso, el análisis de conglomerados sigue siendo fundamentalmente una herramienta exploratoria, por lo que el uso de la membresía de clase calculada de esta manera para derivar aún más una regla de puntuación parece extraño a primera vista.
¿Alguna recomendación, idea o sugerencia para documentos relevantes?
R
: cran.r-project.org/web/packages/adegenet/vignettes/…