Quiero agrupar ~ 22000 puntos. Muchos algoritmos de agrupamiento funcionan mejor con conjeturas iniciales de mayor calidad. ¿Qué herramientas existen que me pueden dar una buena idea de la forma aproximada de los datos?
Quiero poder elegir mi propia métrica de distancia, por lo que un programa al que pueda alimentar una lista de distancias por pares estaría bien. Me gustaría poder hacer algo como resaltar una región o clúster en la pantalla y obtener una lista de los puntos de datos que están en esa área.
Se prefiere el software libre, pero ya tengo SAS y MATLAB.