¿Se puede usar la prueba de Mann-Whitney para comparaciones post-hoc después de Kruskal-Wallis?

9

Tengo una simulación en la que un animal se coloca en un entorno hostil y se cronometra para ver cuánto tiempo puede sobrevivir usando algún enfoque de supervivencia. Hay tres enfoques que puede usar para sobrevivir. Ejecuté 300 simulaciones del animal usando cada enfoque de supervivencia. Todas las simulaciones tienen lugar en el mismo entorno, pero hay algo de aleatoriedad, por lo que es diferente cada vez. Calculo cuántos segundos sobrevive el animal en cada simulación. Vivir más es mejor. Mis datos se ven así:

Approach 1, Approach 2, Approach 2
45,79,38
48,32,24
85,108,44
... 300 rows of these

No estoy seguro de todo lo que hago después de este punto, así que avíseme si estoy haciendo algo estúpido e incorrecto. Estoy tratando de averiguar si hay una diferencia estadística en la vida útil utilizando un enfoque particular.

Realicé una prueba de Shapiro en cada una de las muestras y volvieron con pequeños valores de p, por lo que creo que los datos no están normalizados.

Los datos en las filas no tienen relación entre sí. La semilla aleatoria utilizada para cada simulación fue diferente. Como resultado, creo que los datos no están emparejados.

Debido a que los datos no están normalizados, no están emparejados y había más de dos muestras, realicé una prueba de Kruskal Wallis que regresó con un valor p de 0.048. Luego pasé a un post hoc, seleccionando a Mann Whitney. Realmente no estoy seguro de si Mann Whitney debería usarse aquí.

Comparé cada enfoque de supervivencia con el otro mediante la prueba de Mann Whitney, es decir, {(enfoque 1, enfoque 2), (enfoque 1, enfoque 3), (enfoque 2, enfoque 3)}. No hubo hallazgos de significancia estadística entre el par (enfoque 2, enfoque 3) usando una prueba de dos colas, pero se encontró diferencia de significancia usando una prueba de una cola.

Problemas:

No sé si usar Mann Whitney de esta manera tiene sentido.
No sé si debería usar un Mann Whitney de una o dos colas.

— Phlox Midas
fuente

¿Tiene alguna hipótesis a priori sobre la fuerza relativa de diferentes enfoques (por ejemplo, enfoque1> enfoque2> enfoque3)? Esto es crucial para responder sus preguntas.

— ameba

Tengo la media, la mediana y la desviación estándar y parece que el enfoque 3 es mejor porque tiene una mediana y una media más altas, pero también tiene una desviación estándar mucho más alta, por lo que no estoy seguro. Pero no tenía forma de saber esto de antemano.

— Phlox Midas

¿O también se conoce como la corrección de Bonferroni?

— Phlox Midas

Phlox: si "no había forma de saber esto de antemano ", absolutamente no debe usar una prueba de una cola, solo dos colas (como @Alexis también mencionó en su respuesta).

— ameba

66

@amoeba "her";)

— Alexis

15

$U$

He aquí por qué: la prueba de Dunn es una apropiada post hoc de prueba ^* tras el rechazo de una prueba de Kruskal-Wallis. Si se pasa del rechazo de Kruskal-Wallis a la realización de pruebas de suma de rango por pares (es decir, Wilcoxon o Mann-Whitney), entonces se obtienen dos problemas: (1) los rangos utilizados para las pruebas de suma de rango por pares son no los rangos utilizados por la prueba Kruskal-Wallis; y (2) las pruebas de suma de rango no utilizan la varianza agrupada implícita en la hipótesis nula de Kruskal-Wallis. La prueba de Dunn no tiene estos problemas.

$\alpha$

A menos que tenga razones para creer que el tiempo de supervivencia de un grupo es más largo o más corto que el de otro a priori , debe usar las pruebas de dos lados.

La prueba de Dunn se puede realizar en Stata usando dunntest (tipo net describe dunntest, from(https://www.alexisdinno.com/stata)), y en R usando el paquete dunn.test .

Además, me pregunto si podría adoptar un enfoque de análisis de supervivencia para evaluar si un animal muere y cuándo, en función de diferentes condiciones.

^* Algunas pruebas por pares post hoc menos conocidas para seguir un Kruskal-Wallis rechazado, incluyen Conover-Iman (como Dunn, pero basado en la distribución t , en lugar de la distribución z , implementada para Stata en el paquete conovertest , y para R en el paquete conover.test ), y las pruebas Dwass-Steel-Citchlow-Fligner.

— Alexis
fuente

Gracias por tu respuesta. ¿La prueba de Dunn también se conoce como la prueba de Nemenyi-Damico-Wolfe-Dunn o es una prueba separada?

— Phlox Midas

Pregunto porque no puedo encontrar ninguna implementación de la prueba Dunn.

— Phlox Midas

@ PhloxMidas No sé acerca de la "prueba de Nemenyi-Damico-Wolfe-Dunn", pero Wikipedia implica que es una prueba post hoc apropiada después del rechazo de una prueba de ómnibus en un diseño de medidas repetidas, por ejemplo, después de una prueba de Friedman. Además, vea mi comentario sobre Stata.

— Alexis

7

Una generalización unificadora de Kruskal-Wallis / Wilcoxon es el modelo de probabilidades proporcionales, que admite contrastes generales con intervalos de confianza puntuales o simultáneos para las razones de probabilidades. Esto se implementa en mis rmspaquetes ormy contrast.rmsfunciones de R.

— Frank Harrell
fuente

1

También puede usar la diferencia crítica después de Conover o la diferencia crítica después de Schaich y Hamerle. El primero es más liberal, mientras que el segundo es exacto pero carece de poder. Ambos métodos se ilustran en mi sitio web brightstat.com y la aplicación web de brightstat también le permite calcular estas diferencias críticas y realizar las pruebas post-hoc de inmediato. Kruskal-Wallis en brightstat.com

— Daniel Stricker
fuente

-1

Si está utilizando SPSS, realice la corrección post-hoc de Mann-Whitney con Bonferroni (valor p dividido por el número de grupos).

— Caramba
fuente

El Mann-Whitney sufre de los dos problemas que identifico en mi respuesta, y es una prueba post hoc inapropiada para Kruskal-Wallis.

— Alexis