La paradoja del prisionero


11

Me dan un ejercicio y no puedo entenderlo.

La paradoja del prisionero

Tres prisioneros en confinamiento solitario, A, B y C, han sido condenados a muerte el mismo día pero, debido a que es feriado nacional, el gobernador decide que se le otorgará un indulto. Se informa a los prisioneros de esto, pero se les dice que no sabrán cuál de ellos se librará hasta el día programado para las ejecuciones.

El prisionero A le dice al carcelero "Ya sé que al menos uno de los otros dos prisioneros serán ejecutados, así que si me dices el nombre de uno de los que serán ejecutados, no me habrás dado ninguna información sobre mi propia ejecución" .

El carcelero acepta esto y le dice que C definitivamente morirá.

A entonces razona: “Antes de saber que C debía ser ejecutado, tenía una probabilidad de 1 en 3 de recibir un perdón. Ahora sé que B o yo serán perdonados, las probabilidades han mejorado a 1 en 2. ”.

Pero el carcelero señala "Podrías haber llegado a una conclusión similar si hubiera dicho que B morirá, y estaba obligado a responder B o C, entonces, ¿por qué necesitabas preguntar?".

¿Cuáles son las posibilidades de A de recibir un perdón y por qué? Construya una explicación que convenza a otros de que tiene razón.

Podría abordar esto mediante el teorema de Bayes, dibujando una red de creencias o por sentido común. Cualquier enfoque que elija debería profundizar su comprensión del concepto engañosamente simple de probabilidad condicional.

Aquí está mi análisis:

Esto parece ser el problema del Monty Hall , pero no del todo. Si A dice que I change my place with Bdespués de que le digan que C morirá, tiene 2/3 de posibilidades de ser salvado. Si no lo hace, entonces diría que sus posibilidades son 1/3 de vida, como cuando no cambias tu elección en el problema de Monty Hall. Pero al mismo tiempo, él está en un grupo de 2 hombres, y uno debería morir, por lo que es tentador decir que sus posibilidades son 1/2.

Entonces la paradoja todavía está aquí, ¿cómo abordarías esto? Además, no tengo idea de cómo podría hacer una red de creencias sobre esto, así que estoy interesado en ver eso.


2
"Él está en un grupo de 2 hombres" no implica "sus posibilidades son 1/2"
Henry

Respuestas:


8

Inicialmente hay tres posibilidades con probabilidades iguales:

  • A será liberado (problema )1/3
  • B será liberado (problema )1/3
  • C será liberado (problema )1/3

Con la promesa del mensaje, hay cuatro posibilidades con diferentes probabilidades:

  • A será liberado y se le dice a B que se ejecutará (problema )1/6
  • A será liberado y se le dice a C que se ejecutará (problema )1/6
  • B será liberado y se le dice a C que se ejecutará (problema )1/3
  • C será liberado y se le dice a B que se ejecutará (problema )1/3

Condicional a "A se le dice que C se ejecutará" esto se convierte

  • A será liberado y se le dice a C que se ejecutará (problema )1/3
  • B será liberado y se le dice a A que se ejecutará (problema )2/3

Entonces, después del mensaje A le gustaría intercambiar con B (el problema de Monty Hall) pero no puede y mantiene la probabilidad original de de ser ejecutado.2/3


1
A le gustaría intercambiar con B es la clave. Para tomar una de las explicaciones comunes de Monty Hall: Imagina que hay 1000 prisioneros: A le pregunta al carcelero quién le da 998 nombres. Claramente aprendimos mucho sobre el único tipo que no es A y que no tiene nombre . Pero no hemos aprendido nada acerca de una .
Ben Jackson

Creo que en la posición de A es una muy buena estrategia para él preguntarle al guardia esto. Luego, habla con B y pregúntale si quiere cambiar. Si él está de acuerdo, ustedes pueden preguntar a los verdugos si, si alguno de ellos es liberado, entonces liberen al otro. Desde la perspectiva de B, sus probabilidades no cambian, por lo que no hay razón para que diga no (o para decir que sí, por lo que es una cuestión de presión en ese momento)
Cruncher

8

Creo que estás pensando demasiado en el problema: es un problema de Monty Hall y se aplica la misma lógica.


Se puede desarrollar? Estoy interesado en el razonamiento, no en la respuesta
Benjamin Crouzier

1
@pinouchon: El carcelero es Monty Hall y el prisionero A es el jugador. Morir es análogo a conseguir una cabra; ser indultado es análogo a obtener un premio. Ahora puede traducir directamente cualquier explicación del problema de Monty Hall que le guste: eso abarca muchos razonamientos. +1 a babelproofreader por señalar esto.
whuber

¿Cómo le argumentar en contra de esta declaración: But at the same time, he is in a group of 2 guys, and one should die, so it is tempting to say that his chances are 1/2.. ¿Y qué hay de la red de creencias?
Benjamin Crouzier

1
@Pinouchon Sería constructivo editar su pregunta para centrarse en el aspecto de la red de creencias. El problema de Monty Hall en sí mismo se ha discutido hasta la muerte en muchos, muchos lugares, por lo que no veo ningún punto en repetir ese material aquí.
Whuber

Estoy de acuerdo en que el problema de Monty Hall se ha discutido hasta la muerte, pero a pesar de las afirmaciones de Babelproof y Whuber, no veo dónde el Prisionero A cambia de lugar. Si el carcelero tenía tres sobres sellados, uno que contenía un perdón y dos que contenían sentencias de muerte, A elegía un sobre y el carcelero abría otro (exactamente las mismas reglas que di en una respuesta separada) y mostraba que contenía una sentencia de muerte, y luego preguntó A "¿Te gustaría conservar el sobre que elegiste o prefieres cambiar?" Puedo ver la analogía
Dilip Sarwate

3

No estoy seguro de estar de acuerdo con @babelproofreader en que este es un problema de Monty Hall y se aplica la misma lógica. En el problema de Monty Hall, bajas y seleccionas una puerta. Las reglas son que Monty sabe dónde está el premio, nunca abrirá una puerta que oculte el premio y siempre abrirá una de las puertas no elegidas (es decir, si ha elegido una puerta sin premio, él no abrirá la puerta que tiene elegido y diga: "¡Lo siento, usted pierde!" y lo enviará de vuelta a su asiento), y él siempre le ofrecerá la opción de cambiar a la otra puerta (sin abrir sin abrir) (es decir, no ofrecerá la opción solo cuando haya elegido la puerta con el premio.) En estas circunstancias, si denota el evento de que su selección inicial es la puerta con el premio, entonces . SiAP(A)=13B es el caso de que su elección final sea la puerta con el premio, luego

  • si su estrategia es permanecer siempre , entonces (ya que tomó la decisión correcta al principio y se apega a ella) y (porque usted tomó una decisión equivocada al principio y se apega a ella). Entonces, según la ley de probabilidad total, P(BA)=1P(BAc)=0
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=1×13+0×23=13
  • si su estrategia es cambiar siempre , entonces (ya que tomó la decisión correcta al principio y luego cambió) y (porque cometió un error elección al principio y, por lo tanto, la puerta restante (sin abrir sin abrir) tiene garantizado el premio). Entonces, según la ley de probabilidad total, P(BA)=0P(BAc)=1
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=0×13+1×23=23

Aquí , la situación es diferente. No hay lugares cambiantes con como en "Si A dice que cambio mi lugar con B después de que le digan que C morirá, tiene 2/3 de posibilidades de ser salvado". B

Comentarios agregados: Otra diferencia es que A no tiene información sobre si el carcelero sabe quién será perdonado o si el carcelero está diciendo la verdad cuando dice que C será ejecutado. Por otro lado, el carcelero es perfectamente correcto cuando comenta que decirle a A que C será ejecutado no ha transmitido información útil a A. La analogía más cercana al problema de Monty Hall es que después de que A ha elegido una puerta, Monty abre un no elegida puerta para revelar una cabra y le dice a a "Abre la puerta y vamos a ver lo que tienes", es decir, ninguna oferta de un interruptor. Entonces, las posibilidades de A de ganar el premio (Monty Hall) o de ser indultado (problema del prisionero) son las mismas: cada313 independientemente de si Monty abre una puerta no elegida para revelar una cabra o no, o el carcelero le dice a A que C se ejecutará, o no, exactamente como Henry calculó en detalle.


Creo que podemos suponer que el carcelero tiene esa información, de lo contrario no vale la pena razonar el problema (si el carcelero tiene una probabilidad desconocida de mentir, entonces bien podría no haber dicho nada). En cuanto a su primer punto: claro, el resultado es diferente que en el problema de Monty Hall porque no hay opción para cambiar. Pero la lógica es la misma: al revelar una opción que no es ganadora, se proporciona información sobre otra opción que el carcelero / Monty podría haber elegido.
Ruben van Bergen

2

La respuesta depende de cómo el carcelero elige a qué prisionero nombrar cuando sabe que A debe ser perdonado. Considere dos reglas:

1) El carcelero elige entre B y C al azar, y simplemente dice C en este caso. Entonces la posibilidad de que A sea perdonado es 1/3.

2) El carcelero siempre dice C. Entonces la posibilidad de que A sea perdonado es 1/2.

Todo lo que se nos dice es que el carcelero dijo C, así que no sabemos cuál de estas reglas siguió. De hecho, podría haber otras reglas: tal vez el carcelero tira un dado y solo dice C si saca un 6.



0

Imagine que el carcelero le dice a A que C definitivamente morirá. Y luego le dice a B que C definitivamente morirá. Está claro en este caso que A y B tienen un 50% de perdón cada uno. Pero, ¿cuál es la diferencia entre las dos versiones?


0

El problema de tres prisioneros es diferente al de Monty Hall. La probabilidad de ser perdonado es en realidad para Alice, no , pero solo si el carcelero sigue la estrategia "siempre nombra a Bob cuando sea posible".2 / 31/22/3

Eventos: - Alicia es perdonada. Lo mismo para y . - carcelero le dice a Alice el nombre "Bob" (como respuesta a "quién será ejecutado"). - dice el nombre "Carl". No puede nombrar a Alice por las reglas.B C J J cABCJJc

Estamos interesados ​​enP(A|J)=P(J|A)P(A)/P(J) . Ahora hay dos escenarios:

  1. P(J|A)=12

P(A|J)=12×13/12=13
  1. P(J|A)=1P(J|C)=1P(J|B)=0

P(J)=P(J|B)P(B)+P(J|Bc)P(Bc)=0×13+1×23=23

P(A|J)=1×13/23=12

1
¿"No siempre nombraría a Carl cuando sea posible" sería tan plausible como "siempre nombraría a Bob cuando sea posible"?
Juho Kokkala

Sí, la estrategia S '= "siempre nombra a Carl si es posible" debe ser completamente equivalente si redefinimos J en consecuencia. Si dejamos a J como está y forzamos al carcelero a seguir a S ', hará que todo esté predeterminado: cada vez que J (el carcelero dice Bob), sabemos que no fue posible decir "Carl", por lo que Carl fue perdonado .
Mikhail Volkhov

-1

Después de recibir la información, que el Prisionero C morirá, sus posibilidades cambian a 1/2, pero solo porque las posibilidades de que obtenga esa información ya son 2/3 (se elimina la posibilidad de 1/3 de que el prisionero C obtenga el perdón) )

Y 2/3 * 1/2 es la probabilidad original de ser liberado.

Más convincente es el enfoque opositor:

Suponga que le dicen que el prisionero C recibirá el perdón.
¿Cuáles son sus posibilidades de no ser asesinado?
Todos reconocerán que sus posibilidades son cero, suponiendo que el carcelero no mienta y que solo haya un perdón.

Esta vez, tiene la posibilidad de 1/1, porque la posibilidad de esa información ya era 1/3.


Esto no es correcto; vea el cálculo en la respuesta de Henry que muestra que después de escuchar la información del carcelero, el prisionero A tiene una probabilidad de 2/3 de morir (no 1/2). Esta es la misma probabilidad que tenía antes, por lo que el carcelero tiene razón: lo que le dijo a A no cambió nada para las probabilidades de vida de A. Sin embargo, si B estuviera escuchando, ahora sabría que su posibilidad de morir se redujo a 1/3.
Ruben van Bergen
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.