Recibí la siguiente pregunta como pregunta de prueba para mi examen y simplemente no puedo entender la respuesta.
A continuación se muestra un diagrama de dispersión de los datos proyectados en los dos primeros componentes principales. Deseamos examinar si existe alguna estructura de grupo en el conjunto de datos. Para hacer esto, hemos ejecutado el algoritmo k-means con k = 2 usando la medida de distancia euclidiana. El resultado del algoritmo k-means puede variar entre ejecuciones dependiendo de las condiciones iniciales aleatorias. Ejecutamos el algoritmo varias veces y obtuvimos algunos resultados de agrupación diferentes.
Solo se pueden obtener tres de las cuatro agrupaciones mostradas ejecutando el algoritmo k-means en los datos. ¿Cuál no se puede obtener por medio k? (no hay nada especial sobre los datos)
La respuesta correcta es D. ¿Puede alguno de ustedes explicar por qué?