Me hicieron esta pregunta con en una entrevista. ¿Hay una respuesta "correcta"?
Suponga que los lanzamientos son iid y la probabilidad de caras es . La distribución de la cantidad de cabezas en 400 lanzamientos debe estar cerca de Normal (200, 10 ^ 2), de modo que 220 cabezas estén a 2 desviaciones estándar de la media. La probabilidad de observar dicho resultado (es decir, a más de 2 DE de la media en cualquier dirección) es ligeramente inferior al 5%.
El entrevistador me dijo, esencialmente, "si observo algo> = 2 SD de la media, concluyo que está sucediendo algo más. Apostaría a que la moneda sea justa". Eso es razonable, después de todo, eso es lo que hacen la mayoría de las pruebas de hipótesis. ¿Pero es ese el final de la historia? Para el entrevistador esa parecía ser la respuesta "correcta". Lo que pregunto aquí es si algunos matices están justificados.
No pude evitar señalar que decidir que la moneda no es justa es una conclusión extraña en este contexto de lanzamiento de monedas. ¿Tengo razón al decir eso? Trataré de explicar a continuación.
En primer lugar, yo, y supongo que la mayoría de las personas también, tengo un fuerte historial con respecto a las monedas: es muy probable que sean justos. Por supuesto, eso depende de lo que entendamos por justo: una posibilidad sería definir "justo" como "tener una probabilidad de cabezas 'cercanas' a 0.5, digamos entre 0.49 y 0.51".
(También podría definir 'justo' como el significado de que la probabilidad de caras es exactamente 0.50, en cuyo caso ahora parece poco probable tener una moneda perfectamente justa ).
Su prioridad puede depender no solo de sus creencias generales sobre las monedas, sino también del contexto. Si sacó la moneda de su propio bolsillo, podría estar prácticamente seguro de que es justo; Si tu amigo mago lo sacó de él, tu prior podría poner más peso en las monedas de dos cabezas.
En cualquier caso, es fácil encontrar antecedentes razonables que (i) pongan una gran probabilidad de que la moneda sea justa y (ii) hagan que su posterior sea bastante similar, incluso después de observar 220 caras. Luego concluiría que es muy probable que la moneda sea justa, a pesar de observar un resultado 2 SD de la media.
De hecho, también podría construir ejemplos en los que observar 220 caras en 400 lanzamientos haga que su posterior ponga más peso en la moneda, por ejemplo, si todas las monedas injustas tienen una probabilidad de caras en .
¿Alguien puede arrojar algo de luz sobre esto por mí?
Después de escribir esta pregunta, recordé que había escuchado sobre esta situación general antes, ¿no es la "paradoja" de Lindley ?
Whuber puso un enlace muy interesante en los comentarios: puedes cargar un dado, pero no puedes sesgar una moneda . De la página 3:
No tiene sentido decir que la moneda tiene una probabilidad p de cara, porque puede determinarse completamente por la forma en que se la arroja, a menos que se lance en el aire con un giro rápido y quede atrapada en el aire con sin rebote, en cuyo caso p = 1/2.
¡Muy genial! Esto se relaciona con mi pregunta de una manera interesante: supongamos que sabemos que la moneda está "lanzada en el aire con un giro rápido y atrapada en el aire sin rebotar". Entonces definitivamente no deberíamos rechazar la hipótesis de que la moneda es justa (donde "justo" ahora significa "tener p = 1/2 cuando se lanza de la manera descrita anteriormente"), porque efectivamente tenemos un previo que pone toda la probabilidad en el La moneda es justa. Tal vez eso justifique hasta cierto punto por qué me incomoda rechazar el nulo después de observar 220 cabezas.