Digamos que tenemos los siguientes datos:
set.seed(123)
data <- data.frame(x = c(rnorm(50, 1, 1), rnorm(50, 5, 2)),
y = c(rep('A', 50), rep('B', 50)))
Lo que produce el siguiente diagrama de caja ( boxplot(data$x ~ data$y)
):
Ahora digamos que quiero probar si las dos muestras tienen los mismos parámetros de ubicación (mediana y / o media). En mi caso real, los datos claramente no son normales , así que decidí ejecutar la prueba de Wilcoxon-Mann-Whitney, así:
wilcox.test(data$x ~ data$y)
Sin embargo, me gustaría que la hipótesis alternativa sea que B, data$y
el "segundo" factor, proviene de una distribución con parámetros de posición más altos. Intenté establecer el alternative
parámetro en "mayor" y "menor", pero aparentemente las hipótesis alternativas no son lo que estoy buscando. Por ejemplo, alternative = "greater"
me dice "hipótesis alternativa: el cambio de ubicación verdadero es mayor que 0"; alternative = "less"
me dice "hipótesis alternativa: el cambio de ubicación verdadero es menor que 0".
¿Cómo puedo ajustar la wilcox.test()
función para tener la hipótesis alternativa que quiero (B proviene de una distribución con parámetros de posición más altos que A)? ¿O debería usar otra prueba en su lugar?
rnorm()
, por lo que tienen que ser normales . Me pregunto si estás confundido acerca de la naturaleza del supuesto de normalidad; puede ayudarlo a leer este hilo: ¿Qué pasa si los residuos se distribuyen normalmente pero y no ?