¿En qué condiciones es K-significa agrupación de transformación invariante?

Dado un conjunto de puntos de datos donde ejecutamos K-means en y obtenemos los grupos . $X = \{x_1, x_2, \ldots, x_m\}$ $x_i \in \mathbb{R}^d$ $X$ $c_1, c_2, \ldots, c_k$

Ahora, si creamos un nuevo conjunto de datos donde y y ejecutamos K-means en para obtener los clústeres . $Y = \{y_1, y_2, \ldots, y_m\}$ $y_i = Ax_i + b$ $y_i \in \mathbb{R}^d$ $Y$ $g_1, g_2, \ldots g_k$

¿En qué condiciones de y estamos garantizado para conseguir los mismos grupos? $A$ $b$

Supongamos que K-means utiliza la distancia euclidiana y tiene las mismas condiciones iniciales en ambos algoritmos, es decir, si los centros iniciales para X son entonces los centros iniciales para Y son donde . $c^0_1, \ldots, c^0_k$ $g^0_1, \ldots, g^0_k$ $g^0_i = Ac^0_i + b$

Hasta ahora he pensado que tiene que ser de rango completo puede ser cualquier vector. Sin embargo, no he podido probarlo. $A$ $b$

algorithms clustering

— Ana Echavarria
fuente

La respuesta depende de su algoritmo K-means, pero lo que sigue debería funcionar para algoritmos estándar.

Obtendrá el mismo resultado si su transformación cumple dos condiciones: $T$

Conserva distancias: , donde es su métrica,. $d(z,w) = d(T(z),T(w))$ $d$ $d(z,w) = \|z-w\|$
Conserva promedios: si es una combinación convexa que . $\sum_i p_i z_i$ $T(\sum_i p_i z_i) = \sum_i p_i T(z_i)$

Puede verificar esto revisando el algoritmo, mostrando que siempre toma las mismas decisiones.

— Yuval Filmus
fuente

Gracias Yuval, esto tiene mucho sentido. ¿Significaría esto entonces que para la distancia euclidiana, A tendría que ser una matriz ortogonal para crear una transformación rígida?

— Ana Echavarria

Parece que sí.

— Yuval Filmus