Según los comentarios sobre la respuesta de Ben, voy a ofrecer dos interpretaciones diferentes de esta variante de Monty Hall, que difieren de las de Ruben van Bergen.
Al primero lo llamaré Liar Monty y al segundo Monty no confiable. En ambas versiones, el problema continúa de la siguiente manera:
(0) Hay tres puertas, detrás de una de las cuales hay un automóvil y detrás de las otras dos cabras, distribuidas al azar.
(1) El concursante elige una puerta al azar.
(2) Monty elige una puerta diferente a la puerta del concursante y afirma que hay una cabra detrás de ella.
(3) Se le ofrece al concursante cambiar a la tercera puerta no seleccionada, y el problema es "¿Cuándo debe cambiar el concursante para maximizar la probabilidad de encontrar un automóvil detrás de la puerta?"
En Liar Monty, en el paso (2), si el concursante ha elegido una puerta que contiene una cabra, entonces Monty elige una puerta que contiene el automóvil con alguna probabilidad predefinida (es decir, existe una posibilidad entre 0 y 100% de que mienta la cabra está detrás de alguna puerta). Tenga en cuenta que en esta variante, Monty nunca elige una puerta que contenga el automóvil (es decir, no puede mentir) si el concursante eligió el automóvil en el paso (1).
En Monty no confiable, existe una probabilidad predefinida de que la puerta que elija Monty en el paso (2) contenga un automóvil. Tomo de su comentario sobre la respuesta de Ben que este es el escenario en el que está interesado, y mis dos versiones difieren de las de Ruben van Bergen. Tenga en cuenta que Monty no confiable no es lo mismo que Liar Monty; diferenciaremos rigurosamente entre estos dos casos más adelante. Pero considere esto, en este escenario, la puerta de Monty nunca puede contener el automóvil más de23 del tiempo, ya que el concursante tiene una probabilidad de elegir el auto 13 del tiempo.
Para responder al problema, vamos a tener que usar algunas ecuaciones. Voy a tratar de formular mi respuesta para que sea accesible. Las dos cosas que espero no sean demasiado confusas son la manipulación algebraica de símbolos y la probabilidad condicional. Para el primero, usaremos símbolos para denotar lo siguiente:
SS¯METROMETRO¯dodo¯= El auto está detrás de la puerta a la que el concursante puede cambiar.= El automóvil no está detrás de la puerta a la que el concursante puede cambiar.= El auto está detrás de la puerta que eligió Monty.= El auto no está detrás de la puerta que eligió Monty.= El auto está detrás de la puerta que el concursante eligió en el paso (1).= El automóvil no está detrás de la puerta que el concursante eligió en el paso (1).
Usamos Pr ( ∗ ) para denotar "la probabilidad de ∗", así que, juntos, algo así como Pr ( M¯)significa la probabilidad de que el auto no esté detrás de la puerta que eligió Monty. (Es decir, donde sea que vea una expresión que involucre los símbolos, reemplace los símbolos con los equivalentes "en inglés").
We will also require some rudimentary understanding of conditional probability, which is roughly the probability of something happening if you have knowledge of another related event. This probability will be represented here by expressions such as Pr(S|M¯). The vertical bar | can be thought of as the expression "if you know", so that Pr(S|M¯) can be read as "the probability that the door the contestant can switch to has the car, if you know that the car is not behind Monty's door. In the original Monty Hall problem, Pr(S|M¯)=23, which is larger than Pr(S)=13, which corresponds to the case when Monty has not given you any information.
Ahora demostraré que Monty no confiable es equivalente a Liar Monty. En Liar Monty, se nos da la cantidadPr (MEl | do¯), la probabilidad de que Monty mienta sobre su puerta, sabiendo que el concursante no ha elegido el auto. En Monty no confiable, se nos da la cantidadPr ( M), la probabilidad de que Monty mienta sobre su puerta. Usando la definición de probabilidad condicional Pr ( M y C¯) = Pr ( C¯El | METRO) Pr ( M) = Pr ( MEl | do¯) Pr ( C¯), y reorganizando, obtenemos:
Pr ( M)32Pr ( M)= Pr ( MEl | do¯) Pr ( C¯)Pr ( C¯El | METRO)= Pr ( MEl | do¯) ,
ya que Pr ( C¯), la probabilidad de que el automóvil no esté detrás de la puerta elegida por el concursante es 23 y Pr ( C¯El | METRO), the probability that the car is not behind the contestant's chosen door, if we know that it is behind Monty's door, is one.
Thus, we have shown the connection between Unreliable Monty (represented by LHS of the above equation) and Liar Monty (represented by the RHS). In the extreme case of Unreliable Monty, where Monty chooses a door that hides the car 23 of the time, this is equivalent to Monty lying all the time in Liar Monty, if the contestant has picked a goat originally.
Having shown this, I will now provide enough information to answer the Liar version of the Monty Hall Problem. We want to calculate Pr(S). Using the law of total probability:
Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
since Pr(S|C)=Pr(S|C¯ and M)=0 and Pr(S|C¯ and M¯)=1 (convince yourself of this!).
Continuing:
Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=23−23Pr(M|C¯))
So you see, when Monty always lies (aka Pr(M|C¯))=1) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S), is 23.
From this you can work out the optimal strategies for both Liar, and Unreliable Monty.
Addendum 1
In response to comment (emphasis mine):
"Agregué más detalles en mi comentario a @alex: Monty nunca es hostil ni desviado, simplemente FALIBLE, ya que a veces puede estar equivocado por cualquier motivo, y nunca abre la puerta. La investigación muestra que Monty está equivocado aproximadamente el 33.3% de los tiempo, y el automóvil en realidad resulta estar allí. Esa es una probabilidad posterior de estar en lo correcto el 66.6% del tiempo, ¿correcto? Monty nunca elige SU puerta, y usted nunca elegirá la suya . ¿Estas suposiciones cambian algo? "
Esto es, según tengo entendido, el problema no confiable de Monty Hall presentado al comienzo de mi respuesta.
Por lo tanto, si la puerta de Monty contiene el auto 13 de las veces, tenemos la probabilidad de ganar cuando cambias a la última puerta no seleccionada como:
Pr ( S)= 23- 23Pr ( MEl | do¯)= 23- 23× 32Pr ( M)= 23−13=13
Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)