Diferencia entre ANOVA y prueba de Kruskal-Wallis


20

Estoy aprendiendo R y he estado experimentando con análisis de varianza. He estado corriendo tanto

kruskal.test(depVar ~ indepVar, data=df)

y

anova(lm(depVar ~ indepVar, data=dF))

¿Hay alguna diferencia práctica entre estas dos pruebas? Tengo entendido que ambos evalúan la hipótesis nula de que las poblaciones tienen la misma media.

Respuestas:


28

Hay diferencias en los supuestos y las hipótesis que se prueban.

El ANOVA (y la prueba t) es explícitamente una prueba de igualdad de medios de valores. El Kruskal-Wallis (y Mann-Whitney) puede verse técnicamente como una comparación de los rangos medios .

Por lo tanto, en términos de valores originales, el Kruskal-Wallis es más general que una comparación de medios: prueba si la probabilidad de que una observación aleatoria de cada grupo sea igualmente probable o superior a una observación aleatoria de otro grupo. La cantidad de datos reales que subyace a esa comparación no son las diferencias en las medias ni la diferencia en las medianas, (en el caso de dos muestras) es en realidad la mediana de todas las diferencias por pares: la diferencia de Hodges-Lehmann entre muestras.

Sin embargo, si opta por hacer algunas suposiciones restrictivas, entonces Kruskal-Wallis puede verse como una prueba de igualdad de los medios de población, así como los cuantiles (por ejemplo, medianas) y, de hecho, una amplia variedad de otras medidas. Es decir, si supone que las distribuciones grupales bajo la hipótesis nula son las mismas, y que bajo la alternativa, el único cambio es un cambio distributivo (una llamada " alternativa de cambio de ubicación "), entonces también es una prueba de igualdad de los medios de población (y, simultáneamente, de medianas, cuartiles inferiores, etc.).

[Si hace esa suposición, puede obtener estimaciones e intervalos para los cambios relativos, tal como puede hacerlo con ANOVA. Bueno, también es posible obtener intervalos sin esa suposición, pero son más difíciles de interpretar.]

Si observa la respuesta aquí , especialmente hacia el final, analiza la comparación entre la prueba t y el Wilcoxon-Mann-Whitney, que (al hacer pruebas de dos colas al menos) son el equivalente de ANOVA y Kruskal-Wallis aplicado a una comparación de solo dos muestras; da un poco más de detalle, y gran parte de esa discusión se traslada a Kruskal-Wallis vs ANOVA.

No está completamente claro qué quieres decir con una diferencia práctica. Los usas generalmente de una manera generalmente similar. Cuando se aplican ambos conjuntos de supuestos, generalmente tienden a dar resultados bastante similares, pero ciertamente pueden dar valores p bastante diferentes en algunas situaciones.

Editar: Aquí hay un ejemplo de la similitud de inferencia incluso en muestras pequeñas: aquí está la región de aceptación conjunta para los cambios de ubicación entre tres grupos (el segundo y el tercero en comparación con el primero) muestreados de distribuciones normales (con tamaños de muestra pequeños) para un conjunto de datos en particular, al nivel del 5%:

Regiones de aceptación de diferencias de ubicación en Kruskal-Wallis y Anova

Se pueden distinguir numerosas características interesantes: la región de aceptación ligeramente más grande para el KW en este caso, con su límite que consiste en segmentos de línea recta vertical, horizontal y diagonal (no es difícil entender por qué). Las dos regiones nos dicen cosas muy similares sobre los parámetros de interés aquí.


2
+1. Me atreví a editarlo un poco solo para agregar énfasis donde creía necesario. Vea ahora, si está de acuerdo o no.
ttnphns

@ttnphns gracias por la edición. Hay algunas razones particulares por las que algunas de las cosas que cambiaste estaban allí, por lo que puedo editar algunas de las originales. Sin embargo, tal vez debería aclarar por qué lo escribí como lo había hecho antes. Pero primero quiero pensar detenidamente sobre la mejor manera de mantener la mayor cantidad posible de sus cambios.
Glen_b -Reinstale a Monica el

4

Sí hay. El anovaes un enfoque paramétrico mientras que kruskal.testes un enfoque no paramétrico. Por kruskal.testlo tanto , no necesita ningún supuesto de distribución.
Desde el punto de vista práctico, cuando sus datos están sesgados, anovano sería un buen enfoque para su uso. Eche un vistazo a esta pregunta, por ejemplo.


44
Yo diría que el ANOVA de Kruskal-Wallis hace suposiciones relajadas con respecto a las distribuciones en comparación con el ANOVA paramétrico: las observaciones en cada grupo provienen de poblaciones con forma similar . La heterocedasticidad o las distribuciones muy sesgadas siguen siendo tan problemáticas como con las pruebas tradicionales.
chl

2
¿Cómo es eso, @chl? Los rangos no cambian por sesgo, y KW se basa en el rango. ¿Qué me estoy perdiendo?
Peter Flom - Restablece a Monica

66
3/π

H0 0

1
@ StéphaneLaurent Si las formas no son idénticas, puede dar lugar a malas inferencias. mira mi ejemplo aquí
Frasco

3

Δingrese la descripción de la imagen aquí

()H0:{Δ=0}H1:{Δ0}()H0H0)()H0:{the distributions are equal}

()Δ>0Δ

xyn=1000H0

set.seed(666)
n <- 1000
x <- rnorm(n)
y <- (2*rbinom(n,1,1/2)-1)*rnorm(n,3)
plot(density(x, from=min(y), to=max(y)))
lines(density(y), col="blue")

ingrese la descripción de la imagen aquí

> kruskal.test(list(x,y))

    Kruskal-Wallis rank sum test

data:  list(x, y)
Kruskal-Wallis chi-squared = 2.482, df = 1, p-value = 0.1152

Como dije al principio, no estoy seguro acerca de la construcción precisa de KW. Tal vez mi respuesta sea más correcta para otra prueba no paramétrica (Mann-Whitney? ..), pero el enfoque debería ser similar.


1
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersionComo se menciona en la respuesta de Glen, los comentarios y en muchos otros lugares de este sitio, es cierto, pero es la lectura limitada de lo que hace la prueba. same shape/dispersionen realidad no es intrínseco, pero es una suposición adicional que se usa en algunos y no en otras situaciones.
ttnphns

PD: su segundo ejemplo no contradice ni refuta la prueba de KW. El H0 de la prueba no es distributions are equal, es un error pensar que sí. El H0 es solo que, por lo general, los dos puntos de "condensación de las gravedades" no se desvían entre sí.
ttnphns

H0

1
krusal.test()H0

1
Sí. the equality of the location parameters of the distributiones la formulación correcta (aunque "ubicación" no debe considerarse como una media o mediana, en general). Si asume las mismas formas, entonces, naturalmente, este mismo H0 se convierte en "distribución idéntica".
ttnphns

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.