Tengo un gran conjunto de datos y una similitud de coseno entre ellos. Me gustaría agruparlos usando la similitud de coseno que reúne objetos similares sin necesidad de especificar de antemano el número de grupos que espero.
Leí la documentación de sklearn de DBSCAN y Affinity Propagation, donde ambos requieren una matriz de distancia (no una matriz de similitud de coseno).
Realmente, solo estoy buscando cualquier algoritmo que no requiera a) una métrica de distancia yb) un número predeterminado de clústeres .
¿Alguien sabe de un algoritmo que haría eso?