La agrupación K-means no está supervisada, y la técnica sin supervisión más cercana que utiliza EM es la agrupación basada en modelos (modelos de mezcla gaussiana, GMM). Un problema molesto con el agrupamiento basado en el modelo GMM ocurre cuando muchas de las características están correlacionadas, lo que causa casi singularidad en la matriz de covarianza (correlación) basada en características. En esta situación, la función de probabilidad se vuelve inestable, con índices de condición que alcanzan el infinito, lo que hace que GMM se descomponga por completo.
Por lo tanto, descarte la idea de EM y kNN, ya que se basa en matrices de covarianza (correlación) para análisis sin supervisión. Su consulta sobre la optimización se parece mucho al mapeo de Sammon y al escalamiento multidimensional métrico y no métrico (MDS) clásico. El mapeo de Sammon se basa en derivativos iterativos, mientras que varias formas de MDS son comúnmente descomposiciones iterativas o de un solo paso, que sin embargo pueden optimizarse durante una operación de matriz de un solo paso.
Volviendo a mirar su solicitud: la respuesta es: ya se ha hecho en el mapeo de Sammon.