¿Alguien puede decirme los factores que afectan los requisitos de memoria de significa clustering con un poco de explicación?
44
significa es NP-duro, por lo que hay muchas heurísticas que difieren significativamente, también en el consumo de recursos; ¿estás interesado en algún algoritmo específico?
¿Te refieres al algoritmo de Lloyd? Si es así, creo que los requisitos de memoria para una implementación estándar serían O (log k * n) porque tendría que almacenar una lista de pares (punto, clúster) para el paso de actualización. Debido a que k suele ser pequeño, supongo que generalmente podría salirse con el almacenamiento solo un corto para cada punto, pero no he visto ninguna implementación específica.
—
rm999
Realmente solo necesita un almacenamiento intermedio de tamaño , si está dispuesto a almacenar los datos en el disco y escanearlos en cada pasada. Por supuesto, esto es muy lento, por lo que hay compensaciones involucradas. ¿Qué estabas buscando específicamente?
—
Suresh Venkatasubramanian