Puede convertir su matriz de distancias en datos sin procesar e ingresarlos a la agrupación de K-Means. Los pasos serían los siguientes:
1) Las distancias entre tus N puntos deben ser cuadradas euclidianas. Realice el " doble centrado " de la matriz: reste la media de la fila de cada elemento; en el resultado, resta la media de la columna de cada elemento; en el resultado, agregue la media de la matriz a cada elemento; divide entre menos 2. La matriz que tienes ahora es la matriz SSCP (suma de cuadrados y productos cruzados) entre tus puntos en donde el origen se coloca en el centro geométrico de la nube de N puntos. (Lea la explicación del doble centrado aquí .)
2) Realice PCA (análisis de componentes principales) en esa matriz y obtenga la matriz de carga de componentes NxN . Es probable que algunas de las últimas columnas sean todas 0, así que córtelas. Con lo que se queda ahora es en realidad los puntajes de los componentes principales, las coordenadas de sus N puntos sobre los componentes principales que pasan, como ejes, a través de su nube. Estos datos pueden tratarse como datos sin procesar adecuados para la entrada K-Means.
PD: si sus distancias no son geométricamente correctas al cuadrado euclidianas, puede encontrar problemas: la matriz SSCP puede no ser positiva (semi) definida. Este problema se puede resolver de varias maneras pero con pérdida de precisión.