Se arroja una moneda 900 veces y las cabezas aparecieron 490 veces. ¿El resultado apoya la hipótesis de que la moneda es imparcial?
Se arroja una moneda 900 veces y las cabezas aparecieron 490 veces. ¿El resultado apoya la hipótesis de que la moneda es imparcial?
Respuestas:
Aquí la hipótesis nula natural es que la moneda es imparcial, es decir, que la probabilidad de una cabeza es igual a . La hipótesis alternativa más razonable es eso , aunque uno podría defender la hipótesis alternativa unilateral .
Necesitamos elegir el nivel de significación de la prueba. Eso depende de usted. Dos números tradicionales son% y %
Supongamos que se cumple la hipótesis nula. Entonces el número de cabezas tiene * distribución binomial con mediay desviación estándar .
La probabilidad de que al lanzar una moneda justa el número de caras difiera de por o más (en cualquier dirección) es, por simetría, Esto no es práctico para calcular a mano, pero Wolfram Alpha da una respuesta de aproximadamente .
Por lo tanto, si la moneda no era imparcial, sería bastante improbable una cantidad de caras que difieren de por o más. Tendría una probabilidad inferior al %. entonces al nivel de significancia del %, rechazamos la hipótesis nula.
También podemos usar la aproximación normal al binomio para estimar la probabilidad de que el número de cabezas sea o bajo la hipótesis nula . Nuestra normal tiene una media de y la varianza es con probabilidad la probabilidad de que una normal estándar sea . De las tablas para lo normal, esto es aproximadamente . Doble para tener en cuenta la cola izquierda. Obtenemos aproximadamente , bastante cerca del valor dado por Wolfram Alpha, y menos del \%. Entonces si usamos\% como nuestro nivel de significancia, nuevamente rechazamos la hipótesis nula .
Comentarios: . En la aproximación normal al binomio, obtenemos una mejor aproximación a la probabilidad de que el binomio sea calculando la probabilidad de que lo normal sea . Si desea buscarlo, esta es la corrección de continuidad . Si usamos la aproximación normal con corrección de continuidad, encontramos que la probabilidad de o más o o menos cabezas es de aproximadamente , bastante cerca de la respuesta "exacta" proporcionada por Wolfram Alpha. Por lo tanto, podemos encontrar una estimación muy precisa, como en los viejos tiempos, usando tablas de la norma normal y haciendo la aritmética "a mano".
. Supongamos que usamos la hipótesis alternativa algo menos natural . Si , la probabilidad de o más es de aproximadamente . Por lo tanto, nuevamente al nivel de significancia del %, rechazaríamos la hipótesis nula, de hecho la rechazaríamos incluso si estuviéramos usando el nivel de significancia .
Siempre es necesario establecer un nivel de significancia, ya que es posible que una moneda justa rinda, digamos, o más caras en lanzamientos, lo cual es ridículamente improbable.
40 or more
, pero no 40 or less
o simplemente 40
?
Si la moneda es imparcial, entonces la probabilidad de 'cara' es . Por lo tanto, el número de caras lanzadas en 900 intentos, , tiene una distribución bajo la hipótesis nula de una moneda justa. Entonces, el valor - la probabilidad de ver un resultado tan extremo o más extremo dado que la moneda está lejos, es
Si busca el valor 2 lados , sería
Te lo dejo a ti para describir por qué ese es el caso.
Sabemos que la función de masa para , es
Te lo dejo a ti para calcular el valor que buscas.
Nota: El tamaño de la muestra aquí es lo suficientemente grande como para que pueda usar la aproximación normal a la distribución binomial. He detallado anteriormente cómo calcular el valor exacto .
El ejemplo de la página de Wikipedia sobre el factor Bayes parece bastante relevante para la pregunta. Si tenemos dos modelos, M1 donde la moneda es exactamente imparcial (q = 0.5) y M2 donde se desconoce la probabilidad de una cara, entonces usamos una distribución previa plana en 1. Luego calculamos el factor bayes
dónde
y
Da un factor de Bayes de , que según la escala habitual de interpretación "apenas vale la pena mencionar".
Sin embargo, tenga en cuenta que (i) el factor Bayes tiene una penalización occam incorporada que favorece los modelos simples, y M1 es mucho más simple ya que no tiene parámetros molestos, mientras que M2 sí; (ii) un plano anterior en no es físicamente razonable, en la práctica una moneda sesgada estará cerca de ser justa a menos que la moneda sea obviamente asimétrica; (iii) ha sido un día largo y fácilmente podría haber cometido un error en alguna parte del análisis, desde suposiciones hasta cálculos.
Tenga en cuenta que la moneda está sesgada si es un objeto físico, ya que su asimetría significa que no será tan probable que caiga cara como cruz.
Su pregunta podría abordarse de diferentes maneras.
La prueba tradicional de hipótesis está diseñada para descartar posibilidades, no necesariamente probarlas. En este caso, podemos usar como la hipótesis nula y ver si los datos (490 de 900 cabezas) pueden usarse para rechazar esta hipótesis nula calculando un valor p. Si el valor p es menor que , rechazamos el valor nulo, pero un valor p no significa que podamos decir que los datos son compatibles con el valor nulo, solo que es consistente con el supuesto de que el valor nulo es verdadero , pero en realidad el valor nulo podría ser falso, solo la verdad es un valor de muy cercano a .
El enfoque de "equivalencia" sería definir imparcial no como sino elegir una pequeña región alrededor de 0.5 para considerar como imparcial . Entonces, si el intervalo de confianza en la proporción verdadera se encuentra completamente dentro del intervalo de equivalencia de "imparcial", entonces los datos apoyarían la hipótesis de "imparcialidad".
Otro enfoque sería utilizar un enfoque bayesiano donde comenzamos con una distribución previa de la verdadera proporción incluye una masa puntual de 0,5 y el resto de la probabilidad se distribuye entre los posibles valores. Luego combine eso con los datos para obtener un posterior. Si la probabilidad de posterioun de es lo suficientemente alta, entonces eso respaldaría la afirmación de ser imparcial.
Y una ilustración R:
Sin molestarnos en aproximarnos por lo normal, podemos observar una variable aleatoria distribuida binomial con n = 900 y p = 0.5 bajo la hipótesis nula (es decir, si la moneda fuera imparcial, entonces p = probabilidad de caras (o colas) = 0.5).
Si quisiéramos probar la alternativa de que Ha: p <> 0.5 en alfa 0.05 podemos ver las colas de la distribución debajo de la nula de la siguiente manera y ver que 490 queda fuera del intervalo {421, 479} y por lo tanto rechazamos Ho .
n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479
Para aclarar el enfoque bayesiano:
Empiezas por no saber nada, excepto que eso P(Heads)
está adentro [0,1]
. Entonces comience con una entropía máxima antes -> uniform(0,1)
. Esto se puede representar como una distribución beta -> beta(1,1)
.
Cada vez que lance la moneda, actualice Bayesian de la moneda P(Heads)
multiplicando cada punto en la distribución por su probabilidad (multiplique por x
si lanza caras , multiplique por (1-x)
si obtiene colas) y vuelva a normalizar la probabilidad total a 1 Esto es lo que hace la distribución beta, por lo que si el primer rollo es cara, tendrás beta(2,1)
. En tu caso tienes beta(490,510)
.
A partir de ahí, calcularía el intervalo de probabilidad del 95%, y si 0.5 no está en ese intervalo, comenzaría a sospechar.
La primera vez que realicé este ejercicio, me sorprendió mucho el tiempo que tardó en converger ... Empecé porque alguien dijo "si lanzas una moneda 100 veces, sabes P(Heads)
que +/- 1%" resulta ser totalmente equivocado, necesitas magnitudes de más de 100 vueltas.
Hipótesis nula, Ho: P = 0.5 (P = Q = 0.5)
H1: P> 0.5
donde P es el problema de la cabeza que ocurre.
sabemos z = (pP) / sqrt (PQ / N)
donde p = 490/900 = 0.54
Ahora z = (0.54-0.5) / sqrt ((0.5 * 0.5) / 900)
z = 2
por lo tanto al 5% LOS (es decir, 1.64 <2) Ho es rechazado
por lo tanto, la moneda está sesgada .....