Respuestas:
A Wilcoxon generalmente se le atribuye ser el inventor original de la prueba *, aunque el enfoque de Mann y Whitney fue un gran avance, y ampliaron los casos para los que se tabuló la estadística. Prefiero referirme a la prueba como Wilcoxon-Mann-Whitney, para reconocer ambas contribuciones (también se ve a Mann-Whitney-Wilcoxon; tampoco me importa).
* Sin embargo, la imagen real es un poco más turbia, con varios otros autores que también presentan estadísticas iguales o similares sobre este momento o antes, o en algunos casos hacen contribuciones que están estrechamente relacionadas con la prueba. Al menos parte del crédito debería ir a otro lado.
La prueba de Wilcoxon y la prueba U de Mann-Whitney son equivalentes (y la ayuda indica que lo son) en el sentido de que siempre rechazan los mismos casos en las mismas circunstancias; a lo sumo, sus estadísticas de prueba solo diferirán por un cambio (y en algunos casos, posiblemente un cambio de signo).
La prueba de Wilcoxon se define en más de una forma en la literatura (y esa ambigüedad se remonta a la tabulación original de la estadística de la prueba, más que en un momento), por lo que hay que tener cuidado con la prueba de Wilcoxon que se está discutiendo.
Las dos formas más comunes de definición se discuten en este par de publicaciones:
Prueba de suma de rango de Wilcoxon en R
Diferentes formas de calcular el estadístico de prueba para la prueba de suma de rango de Wilcoxon
Para abordar lo que, específicamente, sucede en R:
La estadística utilizada por wilcox.test
en R se define en la ayuda ( ?wilcox.test
), y la cuestión de la relación con la estadística U de Mann-Whitney se explica allí:
La literatura no es unánime sobre las definiciones de la suma de rango de Wilcoxon y las pruebas de Mann-Whitney
Las dos definiciones más comunes corresponden a la suma de los rangos de la primera muestra con el valor mínimo sustraído o no: R resta y S-PLUS no, dando un valor que es mayor en m (m + 1) / 2 para un primera muestra de talla m. (Parece que el documento original de Wilcoxon usó la suma no ajustada de los rangos, pero las tablas subsiguientes restaron el mínimo).
El valor de R también se puede calcular como el número de todos los pares
(x[i], y[j])
para los cualesy[j]
no es mayor quex[i]
, la definición más común de la prueba de Mann-Whitney.
Esta última oración responde completamente ese aspecto de su pregunta: la versión de W que R saca * también es el valor de U.
Tanto la prueba de suma de rango de Wilcoxon como la prueba de Mann-Whitney son los equivalentes no paramétricos de la prueba t independiente . En algunos casos, la versión de W que R da, también es el valor de U. Pero no en todos los casos.
Cuando usa: wilcox.test(df$var1 ~ df$var2, paired=FALSE)
la W dada es la misma que U. Por lo tanto, puede informarla como la estadística U de Mann-Whitney.
Sin embargo, cuando usa:, en wilcox.test(df$var1 ~ df$var2, paired=TRUE)
realidad está realizando una prueba de rango con signo de Wilcoxon. La prueba de rango con signo de Wilcoxon es el equivalente de la prueba t dependiente .
Fuente: "Estadísticas de descubrimiento utilizando R" por Andy Field (2013)
Sin embargo, tenga en cuenta que el código:
wilcox.test(df$var1 ~ df$var2, paired=FALSE)
(usando '~')
producirá una estadística W diferente que a:
wilcox.test(df$var1, df$var2, paired=FALSE)
(usando ',')
ASK QUESTION
en la parte superior de la página y pregunte allí, entonces podemos ayudarlo adecuadamente. Como eres nuevo aquí, es posible que quieras hacer nuestro recorrido , que tiene información para nuevos usuarios.
wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE)
. Cuando hago eso, obtengo lo mismo en W
ambos sentidos.
paired=TRUE
no es el Wilcoxon-Mann-Whitney sino el rango firmado.