Una forma de asignar un peso a una variable es cambiando su escala. El truco funciona para los algoritmos de agrupación que menciona, a saber. k-medias, enlace promedio ponderado y enlace promedio.
Kaufman, Leonard y Peter J. Rousseeuw. " Encontrar grupos en datos: una introducción al análisis de conglomerados ". (2005) - página 11:
La elección de las unidades de medida da lugar a pesos relativos de las variables. Expresar una variable en unidades más pequeñas dará lugar a un rango mayor para esa variable, lo que tendrá un gran efecto en la estructura resultante. Por otro lado, al estandarizar se intenta dar a todas las variables un peso igual, con la esperanza de lograr la objetividad. Como tal, puede ser utilizado por un practicante que no posee conocimiento previo. Sin embargo, bien puede ser que algunas variables sean intrínsecamente más importantes que otras en una aplicación particular, y luego la asignación de pesos debería basarse en el conocimiento de la materia (véase, por ejemplo, Abrahamowicz, 1985).
Por otro lado, ha habido intentos de idear técnicas de agrupamiento que sean independientes de la escala de las variables (Friedman y Rubin, 1967). La propuesta de Hardy y Rasson (1982) es buscar una partición que minimice el volumen total de los cascos convexos de los grupos. En principio, dicho método es invariable con respecto a las transformaciones lineales de los datos, pero desafortunadamente no existe un algoritmo para su implementación (excepto por una aproximación que está restringida a dos dimensiones). Por lo tanto, el dilema de la estandarización parece inevitable en la actualidad y los programas descritos en este libro dejan la elección del usuario.
Abrahamowicz, M. (1985), El uso de información no numérica para medir diferencias, documento presentado en la Cuarta Reunión Europea de la Sociedad Psicométrica y las Sociedades de Clasificación, 2-5 de julio, Cambridge (Reino Unido).
Friedman, HP y Rubin, J. (1967), sobre algunos criterios invariables para agrupar datos. J. Amer Estadístico. ASSOC6., 2, 1159-1178.
Hardy, A. y Rasson, JP (1982). Anal. Donnies, 7, 41-56.