¿Alguien puede decirme los factores que afectan los requisitos de memoria de significa clustering con un poco de explicación?
44
¿Te refieres al algoritmo de Lloyd? Si es así, creo que los requisitos de memoria para una implementación estándar serían O (log k * n) porque tendría que almacenar una lista de pares (punto, clúster) para el paso de actualización. Debido a que k suele ser pequeño, supongo que generalmente podría salirse con el almacenamiento solo un corto para cada punto, pero no he visto ninguna implementación específica.
—
rm999
Realmente solo necesita un almacenamiento intermedio de tamaño , si está dispuesto a almacenar los datos en el disco y escanearlos en cada pasada. Por supuesto, esto es muy lento, por lo que hay compensaciones involucradas. ¿Qué estabas buscando específicamente?
—
Suresh Venkatasubramanian