Tengo varias distribuciones (10 distribuciones en la figura a continuación).
De hecho, estos son histogramas: hay 70 valores en el eje x que son los tamaños de algunas partículas en una solución y para cada valor de x el valor correspondiente de y es la proporción de partículas cuyo tamaño es alrededor del valor de x.
Me gustaría agrupar estas distribuciones. Actualmente uso un agrupamiento jerárquico con la distancia euclidiana, por ejemplo. No estoy satisfecho con la elección de la distancia. He probado la distancia teórica de la información, como Kullback-Leibler, pero hay muchos ceros en los datos y esto causa dificultades. ¿Tiene una propuesta de una distancia apropiada y / u otro método de agrupamiento?