Los datos del mundo real a veces tienen una cantidad natural de clústeres (intentar agruparlos en una cantidad de clústeres menor que un poco de magia k causará un aumento dramático del costo de la agrupación). Hoy asistí a una conferencia del Dr. Adam Meyerson y se refirió a ese tipo de datos como "datos separables".
¿Cuáles son algunas formalizaciones de agrupamiento, además de K-means, que podrían ser susceptibles de algoritmos de agrupamiento (aproximaciones o heurísticas) que explotarían la separabilidad natural en los datos?