Hay diferencias en los supuestos y las hipótesis que se prueban.
El ANOVA (y la prueba t) es explícitamente una prueba de igualdad de medios de valores. El Kruskal-Wallis (y Mann-Whitney) puede verse técnicamente como una comparación de los rangos medios .
Por lo tanto, en términos de valores originales, el Kruskal-Wallis es más general que una comparación de medios: prueba si la probabilidad de que una observación aleatoria de cada grupo sea igualmente probable o superior a una observación aleatoria de otro grupo. La cantidad de datos reales que subyace a esa comparación no son las diferencias en las medias ni la diferencia en las medianas, (en el caso de dos muestras) es en realidad la mediana de todas las diferencias por pares: la diferencia de Hodges-Lehmann entre muestras.
Sin embargo, si opta por hacer algunas suposiciones restrictivas, entonces Kruskal-Wallis puede verse como una prueba de igualdad de los medios de población, así como los cuantiles (por ejemplo, medianas) y, de hecho, una amplia variedad de otras medidas. Es decir, si supone que las distribuciones grupales bajo la hipótesis nula son las mismas, y que bajo la alternativa, el único cambio es un cambio distributivo (una llamada " alternativa de cambio de ubicación "), entonces también es una prueba de igualdad de los medios de población (y, simultáneamente, de medianas, cuartiles inferiores, etc.).
[Si hace esa suposición, puede obtener estimaciones e intervalos para los cambios relativos, tal como puede hacerlo con ANOVA. Bueno, también es posible obtener intervalos sin esa suposición, pero son más difíciles de interpretar.]
Si observa la respuesta aquí , especialmente hacia el final, analiza la comparación entre la prueba t y el Wilcoxon-Mann-Whitney, que (al hacer pruebas de dos colas al menos) son el equivalente de ANOVA y Kruskal-Wallis aplicado a una comparación de solo dos muestras; da un poco más de detalle, y gran parte de esa discusión se traslada a Kruskal-Wallis vs ANOVA.
No está completamente claro qué quieres decir con una diferencia práctica. Los usas generalmente de una manera generalmente similar. Cuando se aplican ambos conjuntos de supuestos, generalmente tienden a dar resultados bastante similares, pero ciertamente pueden dar valores p bastante diferentes en algunas situaciones.
Editar: Aquí hay un ejemplo de la similitud de inferencia incluso en muestras pequeñas: aquí está la región de aceptación conjunta para los cambios de ubicación entre tres grupos (el segundo y el tercero en comparación con el primero) muestreados de distribuciones normales (con tamaños de muestra pequeños) para un conjunto de datos en particular, al nivel del 5%:
Se pueden distinguir numerosas características interesantes: la región de aceptación ligeramente más grande para el KW en este caso, con su límite que consiste en segmentos de línea recta vertical, horizontal y diagonal (no es difícil entender por qué). Las dos regiones nos dicen cosas muy similares sobre los parámetros de interés aquí.