Estoy evaluando la efectividad de 5 métodos diferentes para predecir un resultado binario particular (llámelos 'Éxito' y 'Fracaso'). Los datos se ven así:
Method Sample_Size Success Percent_Success
1 28 4 0.14
2 19 4 0.21
3 24 7 0.29
4 21 13 0.61
5 22 9 0.40
Me gustaría realizar una prueba entre estos 5 métodos para evaluar la superioridad relativa de los métodos. En otras palabras, quiero ordenar los métodos en orden de rendimiento como método 1> método 2> ... método 5. Para evitar el problema de las comparaciones múltiples, planeo hacer una prueba de permutación en las siguientes líneas:
Paso 1: agrupe todos los datos para que el tamaño de la muestra general sea 114 con 37 éxitos generales.
Paso 2: Divida aleatoriamente los datos en 5 grupos con los tamaños de muestra correspondientes de 28, 19, 24, 21 y 22.
Paso 3: Incremente un contador si el orden observado de Percent_Success del paso 2 es consistente con el orden de mis datos.
Paso 4: Repita los pasos 2 y 3 muchas veces (digamos 10000).
Valor p deseado = Valor de contador final / 10000.
Preguntas:
¿Está bien el procedimiento anterior?
¿Hay algo en R que me permita realizar la prueba anterior?
Cualquier sugerencia de mejora o métodos alternativos sería útil.