Tengo una simulación en la que un animal se coloca en un entorno hostil y se cronometra para ver cuánto tiempo puede sobrevivir usando algún enfoque de supervivencia. Hay tres enfoques que puede usar para sobrevivir. Ejecuté 300 simulaciones del animal usando cada enfoque de supervivencia. Todas las simulaciones tienen lugar en el mismo entorno, pero hay algo de aleatoriedad, por lo que es diferente cada vez. Calculo cuántos segundos sobrevive el animal en cada simulación. Vivir más es mejor. Mis datos se ven así:
Approach 1, Approach 2, Approach 2
45,79,38
48,32,24
85,108,44
... 300 rows of these
No estoy seguro de todo lo que hago después de este punto, así que avíseme si estoy haciendo algo estúpido e incorrecto. Estoy tratando de averiguar si hay una diferencia estadística en la vida útil utilizando un enfoque particular.
Realicé una prueba de Shapiro en cada una de las muestras y volvieron con pequeños valores de p, por lo que creo que los datos no están normalizados.
Los datos en las filas no tienen relación entre sí. La semilla aleatoria utilizada para cada simulación fue diferente. Como resultado, creo que los datos no están emparejados.
Debido a que los datos no están normalizados, no están emparejados y había más de dos muestras, realicé una prueba de Kruskal Wallis que regresó con un valor p de 0.048. Luego pasé a un post hoc, seleccionando a Mann Whitney. Realmente no estoy seguro de si Mann Whitney debería usarse aquí.
Comparé cada enfoque de supervivencia con el otro mediante la prueba de Mann Whitney, es decir, {(enfoque 1, enfoque 2), (enfoque 1, enfoque 3), (enfoque 2, enfoque 3)}. No hubo hallazgos de significancia estadística entre el par (enfoque 2, enfoque 3) usando una prueba de dos colas, pero se encontró diferencia de significancia usando una prueba de una cola.
Problemas:
- No sé si usar Mann Whitney de esta manera tiene sentido.
- No sé si debería usar un Mann Whitney de una o dos colas.