La notificación después de la tabla ANOVA después del análisis de K-medias indica que los niveles de significancia no deben considerarse como la prueba de medias iguales, ya que la solución de clúster se ha derivado en base a la distancia euclidiana para maximizar la distancia. ¿Qué prueba debo usar para mostrar si las medias de las variables de agrupación difieren entre las agrupaciones? He visto esta advertencia en la tabla ANOVA proporcionada por k-means output, pero en algunas referencias veo que se ejecutan pruebas ANOVA post-hoc. ¿Debo ignorar las salidas ANOVA k-mean y ejecutar ANOVA unidireccional con pruebas post-hoc e interpretarlas de manera tradicional? ¿O solo puedo dar a entender la magnitud del valor F y qué variables contribuyeron más a la diferencia? Otra confusión es que las variables de agrupamiento no se distribuyen normalmente violando el supuesto de ANOVA, entonces podría usar la prueba no paramétrica de Kruskal-Wallis, pero se supone que tiene las mismas distribuciones. Las distribuciones entre grupos para las variables específicas no parecen iguales, algunas están sesgadas positivamente, otras son negativas ... Tengo 1275 muestras grandes, 5 grupos, 10 variables de agrupación medidas en puntajes de PCA.