Hasta donde sé, la "media" de un grupo y el centroide de un solo grupo son la misma cosa, aunque el término "centroide" podría ser un poco más preciso que "media" cuando se trata de datos multivariados.
Para encontrar el centroide, se calcula la media (aritmética) de las posiciones de los puntos por separado para cada dimensión. Por ejemplo, si tuviera puntos en:
- (-1, 10, 3),
- (0, 5, 2) y
- (1, 20, 10),
entonces el centroide se ubicaría en ((-1 + 0 + 1) / 3, (10 + 5 + 20) / 3, (3 + 2 + 10) / 3), lo que simplifica (0, 11 2/3, 5) (Nota: el centroide no tiene que ser, y rara vez es, uno de los puntos de datos originales)
El centroide también se denomina a veces el centro de masa o baricentro, en función de su interpretación física (es el centro de masa de un objeto definido por los puntos). Al igual que la media, la ubicación del centroide minimiza la distancia al cuadrado de los otros puntos.
Una idea relacionada es el medoide , que es el punto de datos que es "menos diferente" de todos los otros puntos de datos. A diferencia del centroide, el medoide tiene que ser uno de los puntos originales. También puede interesarle la mediana geométrica, que es análoga a la mediana, pero para datos multivariados. Ambos son diferentes del centroide.
UNAsicentroide ( A )centroide ( B )unayoUNAdist (ayo,b1)dist ( ayo, b2)dist ( ayo, bnorte)