Tengo un algoritmo de agrupación (no k-significa) con el parámetro de entrada (número de agrupaciones). Después de realizar la agrupación, me gustaría obtener una medida cuantitativa de la calidad de esta agrupación. El algoritmo de agrupamiento tiene una propiedad importante. Para si ingreso puntos de datos sin ninguna distinción significativa entre ellos a este algoritmo, como resultado obtendré un grupo que contiene puntos de datos y un grupo con 1 punto de datos. Obviamente esto no es lo que quiero. Por lo tanto, quiero calcular esta medida de calidad para estimar la razonabilidad de esta agrupación. Lo ideal sería poder comparar estas medidas para diferentes k . Así que voy a ejecutar agrupaciones en el rango de ky elige el que tenga la mejor calidad. ¿Cómo calculo esa medida de calidad?
ACTUALIZAR:
Aquí hay un ejemplo cuando es un mal agrupamiento. Digamos que hay 3 puntos en un plano que forman un triángulo equilátero. Dividir estos puntos en 2 grupos es obviamente peor que dividirlos en 1 o 3 grupos.