Tengo un conjunto de datos de miles de puntos y un medio para medir la distancia entre dos puntos, pero los puntos de datos no tienen dimensionalidad. Quiero un algoritmo para encontrar centros de clúster en este conjunto de datos. Me imagino que debido a que los datos no tienen dimensiones, un centro de clúster podría constar de varios puntos de datos y una tolerancia, y la membresía dentro del clúster podría determinarse por el promedio de la distancia de un punto de datos a cada punto de datos en el centro del clúster.
perdóneme si esta pregunta tiene una solución bien conocida, ¡sé muy poco sobre este tipo de problema! mi (muy limitada) investigación solo ha encontrado algoritmos de agrupamiento para datos dimensionales, pero me disculpo de antemano si me he perdido algo obvio.
¡gracias!