Comencemos con el problema regular de Monty Hall. Tres puertas, detrás de una de las cuales hay un automóvil. Los otros dos tienen cabras detrás de ellos. Eliges la puerta número 1 y Monty abre la puerta número 2 para mostrarte que hay una cabra detrás de esa. ¿Debería cambiar su suposición a la puerta número 3? (Tenga en cuenta que los números que usamos para referirnos a cada puerta no importan aquí. Podríamos elegir cualquier orden y el problema es el mismo, así que para simplificar las cosas podemos usar esta numeración).
La respuesta, por supuesto, es sí, como ya sabes, pero repasemos los cálculos para ver cómo cambian más adelante. Sea C el índice de la puerta con el auto y M denote el evento de que Monty reveló que la puerta 2 tiene una cabra. Necesitamos calcular p(C=3|M) . Si esto es mayor que 1 / 2 , tenemos que cambiar nuestra suposición de que la puerta (ya que sólo tenemos dos opciones restantes). Esta probabilidad viene dada por:
p ( C= 3 | METRO) = p ( MEl | do= 3 )p ( MEl | do= 1 ) + p ( MEl | do= 2 ) + p ( MEl | do= 3 )
(Esto es solo aplicar la regla de Bayes con un plano anterior en
do)
p ( MEl | do= 3 )es igual a 1: si el automóvil está detrás de la puerta número 3, entonces Monty no tuvo más remedio que abrir la puerta número 2 como lo hizo.
2: si el automóvil está detrás de la puerta 1, entonces Monty tuvo la opción de abrir cualquiera de las puertas restantes, 2 o 3.
pp ( MEl | do= 1 ) es igual a
1 / 2p ( MEl | do= 2 ) es igual a 0, porque Monty nunca abre la puerta que sabe que tiene el auto. Al completar estos números, obtenemos:
p ( C= 3 | METRO) = 10.5 + 0 + 1= 23
¿Cuál es el resultado con el que estamos familiarizados?
Ahora consideremos el caso en el que Monty no tiene un conocimiento perfecto de qué puerta tiene el automóvil. Entonces, cuando elige su puerta (a la que nos referiremos como puerta número 2), podría elegir accidentalmente la que tiene el automóvil, porque cree que tiene una cabra. Deje do′ la puerta que Monty cree que tiene el automóvil, y sea p ( C′El | do) la probabilidad de que él piense que el automóvil está en un lugar determinado, condicional a su ubicación real. Asumiremos que esto se describe mediante un único parámetro q que determina su precisión, de modo que: p ( C′= x | do= x ) = q= 1 - p ( C′≠ x | do= x )es 0, Monty siempre está equivocado (lo que sigue siendo informativo). Si q es 1 / 3 , la información de Monty no es mejor que adivinar al azar es. . Siq es igual a 1, Monty siempre tiene razón. Siqq1 / 3
Esto significa que ahora tenemos:
p ( MEl | do= 3 ) = ∑Xp ( MEl | do′= x ) p ( C′= x | do= 3 )
= p ( MEl | do′= 1 ) p ( C′= 1 | do= 3 ) + p ( MEl | do′= 2 ) p ( C′= 2 | do= 3 )+ p ( MEl | do′= 3 ) p ( C′= 3 | do= 3 )
= 12× 12( 1 - q) + 0 × 12( 1 - q) + 1 × q
= 14 4- q4 4+ q= 34 4q+ 14 4
Es decir, si el automóvil estaba realmente detrás de la puerta 3, había tres posibilidades que podrían haber jugado: (1) Monty pensó que estaba detrás de 1, (2) Monty pensó 2 o (3) Monty pensó 3. La última opción ocurre con probabilidad q (con qué frecuencia lo hace bien), los otros dos dividen la probabilidad de que se equivoque ( 1 - q) entre ellos. Entonces, dado cada escenario, ¿cuál es la probabilidad de que hubiera elegido señalar la puerta número 2, como lo hizo? Si pensara que el automóvil estaba detrás de 1, esa probabilidad era 1 en 2, ya que podría haber elegido 2 o 3. Si pensara que estaba detrás de 2, nunca hubiera elegido apuntar a 2. Si pensara que estaba detrás de 3 , él siempre habría elegido 2.
De manera similar, podemos calcular las probabilidades restantes:
p ( MEl | do=1)=∑xp(M|C′=x)p(C′=x|C=1)
=12×q+1×12(1−q)
=q2+12-q2=12
p ( MEl | do= 2 ) = ∑Xp ( MEl | do′= x ) p ( C′= x | do= 2 )
= 12× 12( 1 - q) + 1 × 12( 1 - q)
= 34 4- 34 4q
Al completar todo esto, obtenemos:
p ( C= 3 | METRO) = 34 4q+ 14 412+ 34 4- 34 4q+ 34 4q+ 14 4
= 0,75 q+ 0.251,5
Como verificación de cordura, cuando
q= 1, podemos ver que recuperamos nuestra respuesta original de
11,5= 23 .
Entonces, ¿cuándo deberíamos cambiar? Asumiré por simplicidad que no se nos permite cambiar a la puerta que Monty señaló. Y, de hecho, mientras Monty sea al menos algo probable que sea correcto (más que adivinar al azar), la puerta a la que señala siempre será menos probable que los demás para tener el automóvil, por lo que esta no es una opción viable para nosotros de todos modos Por lo tanto, solo tenemos que considerar las probabilidades de las puertas 1 y 3. Pero mientras que antes era imposible que el automóvil estuviera detrás de la puerta 2, esta opción ahora tiene una probabilidad distinta de cero, por lo que ya no es el caso de que debamos cambiar cuando p(C=3|M)>0.5 , sino que deberíamos cambiar cuando p(C=3|M)>p(C=1|M) (que solía ser lo mismo). Esta probabilidad viene dada porp(C=1|M)=0.51.5=13 , igual que en el problema original de Monty Hall. (Esto tiene sentido ya que Monty nunca puede apuntar hacia la puerta 1, independientemente de lo que esté detrás, por lo que no puede proporcionar información sobre esa puerta. Más bien, cuando su precisión cae por debajo del 100%, el efecto es que alguna probabilidad "se escapa" hacia la puerta 2 en realidad tiene el auto.) Entonces, necesitamos encontrarqtal quep(C=3|M)>13 :
0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
Entonces, básicamente, esta era una forma muy larga de descubrir que, siempre y cuando el conocimiento de Monty sobre la verdadera ubicación del automóvil sea mejor que una suposición aleatoria, debe cambiar las puertas (lo que en realidad es algo obvio, cuando piensa en eso). También podemos calcular cuánto más probabilidades tenemos de ganar cuando cambiamos, en función de la precisión de Monty, ya que esto viene dado por:
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
(que, cuando
q=1 , da una respuesta de 2, igualando el hecho de que duplicamos nuestras posibilidades de ganar cambiando las puertas en el problema original de Monty Hall).
Editar: La gente preguntaba sobre el escenario en el que se nos permite cambiar a la puerta que señala Monty, lo que se vuelve ventajoso cuando q<13 , es decir, cuando Monty es un "mentiroso" (algo) confiable. En el escenario más extremo, cuandoq=0, esto significa que la puerta que Monty cree que realmente tiene el auto tiene una cabra. Sin embargo, tenga en cuenta que las dos puertas restantes aún podrían tener un automóvil o una cabra.
El beneficio de cambiar a la puerta 2 viene dado por:
p(C=2|M)p(C=1|M)=0.75−0.75q1.513= 1.5 - 1.5 q
Que solo es mayor que 1 (y por lo tanto vale la pena cambiar a esa puerta) si
1,5 q< 0.5, es decir, si
q< 13 , que ya establecimos fue el punto de inflexión. Curiosamente, el beneficio máximo posible para cambiar a la puerta 2, cuando
q= 0, es solo 1.5, en comparación con una duplicación de sus probabilidades de ganar en el problema original de Monty Hall (cuando
q= 1 ).
La solución general se da combinando estas dos estrategias de conmutación: cuando q> 13 , siempre cambias a la puerta 3; de lo contrario, cambie a la puerta 2.