Estoy tratando de resolver la siguiente pregunta:
El jugador A ganó 17 de 25 juegos, mientras que el jugador B ganó 8 de 20: ¿hay una diferencia significativa entre ambas proporciones?
Lo que hay que hacer en R que viene a la mente es lo siguiente:
> prop.test(c(17,8),c(25,20),correct=FALSE)
2-sample test for equality of proportions without continuity correction
data: c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
-0.002016956 0.562016956
sample estimates:
prop 1 prop 2
0.68 0.40
Entonces, esta prueba dice que la diferencia no es significativa al nivel de confianza del 95%.
Como sabemos que prop.test()
solo se está usando una aproximación, quiero que las cosas sean más exactas usando una prueba binomial exacta, y lo hago en ambos sentidos:
> binom.test(x=17,n=25,p=8/20)
Exact binomial test
data: 17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
0.4649993 0.8505046
sample estimates:
probability of success
0.68
> binom.test(x=8,n=20,p=17/25)
Exact binomial test
data: 8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
0.1911901 0.6394574
sample estimates:
probability of success
0.4
Ahora esto es extraño, ¿no? ¡Los valores p son totalmente diferentes cada vez! En ambos casos, ahora los resultados son (altamente) significativos, pero los valores p parecen saltar de manera bastante casual.
Mis preguntas
- ¿Por qué son los valores de p que diferente cada vez?
- ¿Cómo realizar una prueba binomial exacta de dos proporciones muestrales en R correctamente?
prop.test
vschisq.test
), el mismo concepto subyacente está en esta pregunta . Está ejecutando tres pruebas diferentes con diferentes "hipótesis nulas" en cada uno de sus tres ejemplos.