Sobre la paradoja


8

Hay dos sobres. Uno contiene x dinero y el otro contiene 2x cantidad de dinero. La cantidad exacta " x " es desconocida para mí, pero sé lo anterior. Escojo un sobre y lo abro. Veo y dinero en él, obviamente donde y{x,2x} .

Ahora me ofrecen guardar o cambiar los sobres.

El valor esperado de conmutación es (122y+1212y)=54y. El valor esperado de mantener mi sobre esy.

Parece que siempre debería cambiar los sobres. Mis dos preguntas:

¿Es correcto este razonamiento?

¿Es diferente si yo no estoy autorizado a abrir el sobre y ver el y cantidad de dinero, y luego se me da la opción de cambiar de forma indefinida?



1
No puede simplemente tomar la expectativa, debe comenzar con creencias sobre xy actualizar sus creencias de acuerdo con la regla de Bayes. Una vez que vea y, sus creencias sobre el sobre que abrió habrán cambiado.
HRSE

Digamos que x se distribuye uniformemente entre 0 y . ¿Y que?
Kitsune Cavalry

@KitsuneCavalry No existe tal distribución. (Por favor, envíeme un programa que genere dicha distribución). De hecho, no hay una resolución que genere las creencias principales dadas en su pregunta para todos los valores de . En el enlace de Herr K. esto se explica en en.wikipedia.org/wiki/…y
Giskard

3
@Kitsune Cavalry La distribución uniforme sobre la media línea (o la línea completa) es un conocido incorrecto previo en las estadísticas bayesianas, vea las estadísticas stats.stackexchange.com/a/97790/28746 o stats.stackexchange.com/a/ 35794/28746
Alecos Papadopoulos el

Respuestas:


5

Aquí hay un enfoque de "maximización de utilidad esperada / teoría del juego" sobre el tema (con un guión de probabilidad de teoría de conjuntos). En dicho marco, las respuestas parecen claras.

LOCAL

Se nos dice con absoluta honestidad que, para una cantidad monetaria estrictamente positiva, los siguientes dos tickets se colocaron en una casilla: { A = x , B = 2 x } con el número de identificación asignado 1 y { A = 2 x , B = x } con el número de identificación asignado 0 . Luego se ejecutó un sorteo de una variable aleatoria de Bernoulli ( p = 0.5 ) , y en base al resultado y el evento que ocurrió, las cantidades x yx{A=x,B=2x}1{A=2x,B=x}0(p=0.5)x se colocaron en sobres A y B . No se nos dice cuál es el valor de x , o qué cantidad fue a qué sobre.2xABx

Primer CASO: elija un sobre con la opción de cambiar sin abrirlo

El primer problema es ¿cómo elegimos un sobre ? Esto tiene que ver con las preferencias. Así que suponemos que se espera maximizan la utilidad, la función de utilidad .u()

Podemos modelar la estructura probabilística aquí considerando dos variables aleatorias dicotómicas, y B que representan las envolventes, y la cantidad en ellas. El soporte de cada uno es { x , 2 x } . Pero no son independientes. Entonces tenemos que comenzar con la distribución conjunta. En forma de tabla, la distribución conjunta y las distribuciones marginales correspondientes sonAB{x,2x}

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

Esto nos dice que y B tienen distribuciones marginales idénticas.AB

Pero esto significa que no importa cómo elijamos los sobres, porque siempre obtendremos la misma utilidad esperada ,

0.5u(x)+0.5u(2x)

A lo que nos enfrentamos aquí es a una apuesta compuesta (cómo elegir un sobre) sobre dos apuestas idénticas (cada sobre). Podemos elegir con probabilidad 1 , 0 o cualquier cosa intermedia (y complementariamente para B ). No importa. Siempre obtendremos la misma utilidad esperada. Tenga en cuenta que nuestra actitud hacia el riesgo no juega un papel aquí.A10B

Así que elegimos un sobre, digamos , y lo estamos mirando. ¿Cuál es ahora nuestra utilidad esperada? Exactamente igual que antes de elegir . Elegir un sobre de cualquier manera no afecta las probabilidades de lo que hay dentro.A

B

AB

Así que aquí, somos indiferentes al cambio. , y de hecho también podríamos aleatorizar.

2do CASO: ABRIR EL SOBRE CON LA OPCIÓN DE CAMBIAR DESPUÉS

Ay{x,2x}

Veamos. Me pregunto que es

P(A=xA{x,2x})=?

{x,2x}AA

Pero también me pregunto qué es

P(B=xA{x,2x})=?

{A{x,2x}}(A,B)BB

u(y)

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

p=0.5

p=0.5 y=xp=0.5y=2x

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

u(x)u(2x)u(y)u(y)xy=xu(2x)=u(2y)y=2xu(x)=u(y/2)

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

Ahora se conocen todos los pagos en la matriz. ¿Existe una estrategia dominante pura?

El resultado esperado de la estrategia "Switch" es

E(VS)=0.5u(2y)+0.5u(y/2)

La recompensa esperada de la estrategia "No cambiar" es

E(VDS)=u(y)

Deberíamos cambiar si

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

Y ahora , la actitud hacia el riesgo se vuelve crítica. No es difícil deducir que, bajo un comportamiento neutral y de asunción de riesgos, deberíamos cambiar.

En cuanto al comportamiento de aversión al riesgo , encuentro un resultado elegante:

Para funciones de utilidad "menos cóncavas" (estrictamente anteriores) que logarítmicas (por ejemplo, raíz cuadrada), entonces deberíamos cambiar.

u(y)=lny

Por "más cóncava" que las funciones de utilidad logarítmica (en sentido estricto) a continuación, debemos no interruptor.

Cierro con el diagrama del caso logarítmico

ingrese la descripción de la imagen aquí

y=4y/2=2,2y=8ΓΔΕ5050ΔΓΔΕln(4)


Invocar la "aversión al riesgo" a través de una función de utilidad logarítmica no resuelve la paradoja. Como se ha señalado por @HRSE, utilizando el teorema de Bayes, las probabilidades de que los pagos son y son no 0,5 después de ver la cantidad en el primero sobre. Esto sólo sería mantener durante un uniforme muy cuestionable incorrecta en antes (para ). Si se utiliza un previo adecuado en (que refleja las creencias de uno sobre ), la solución es cambiar si es lo suficientemente pequeño y mantener la primera envoltura si es lo suficientemente grande. Ver jstor.org/ estable / 2685310 .u(2y)u(y/2xx>0xxyy
Jarle Tufto

@JarleTufto A mi modo de ver, el uniforme anterior es el previo correcto, si uno decide creer a los organizadores del juego, cuando dicen que las cantidades de dinero se pusieron en los sobres después de un sorteo de Bernoulli con . Si uno quiere sospechar, no creerle a los organizadores y formar alguna otra creencia previa, es, por supuesto, su derecho, pero tendría que venir con algún argumento para convencerme de a) por qué los organizadores mienten yb) cómo elige el diferente antes de elegir? Tenga en cuenta que mi respuesta presupone que creemos en los organizadores sobre el asunto. p=0.5
Alecos Papadopoulos

Por supuesto, estoy de acuerdo en que se le da cada sobre que contiene cantidades y respectivamente con probabilidades iguales de 1/2. Lo que estoy diciendo es que el uniforme incorrecto implícito anterior en que usas, es decir, , para todo conduce a la paradoja porque el teorema de Bayes conduce a donde es la cantidad observada en el primer sobre. En su lugar, utilizando un adecuado , estas probabilidades condicionales difieren y la decisión óptima depende de (y, por supuesto, de la función de utilidad). X2XXπ(x)=1x>0P(X=y|Y=y)=P(X=y/2|Y=y)=1/2yπ(x)y
Jarle Tufto

@JarleTufto Este incorrecto antes de mencionarlo, ¿refleja las probabilidades relacionadas con qué?
Alecos Papadopoulos

La cantidad de dinero en los dos sobres es y . La distribución de probabilidad previa representa sus creencias acerca de antes de abrir cualquier sobre. O implícitamente estás usando este previo particular o estás cometiendo la falacia de equiparar las probabilidades condicionales inversas. X2XX
Jarle Tufto

0

Si abre el sobre E1 y ve que su valor es E1 = Y , entonces es cierto que el valor del otro sobre E2 está en {E2 = Y / 2, E2 = 2Y} .

También es cierto que el valor esperado de esa envolvente es (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

El error es suponiendo que Pr (E2 = Y / 2) = Pr (E2 = 2y) = 1/2 independientemente de lo que Y es. Una forma simplista de mostrar esto es asumir que cada sobre contiene papel moneda estadounidense de varias denominaciones. Si Y = $ 1 , entonces es imposible que E2 sea Y / 2 .

Una prueba más rigurosa es demasiado detallada para proporcionar aquí, pero un resumen de la misma es suponer primero que, para cualquier valor Z , que Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Este es esencialmente el mismo supuesto que en el último párrafo, expandido a un rango de valores. Pero si esto es cierto para cualquier valor de Z , significa que Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) es constante para cada valor de N , desde -inf hasta inf. Como eso es imposible, la suposición no puede ser correcta.

+++++

Eso puede haber sido un poco confuso, así que déjame probar un ejemplo. Te dan dos juegos de dos sobres. En un conjunto, contienen 10 y 20 dólares. En el otro, contienen 20 y 40. Usted elige un conjunto y luego abre un sobre en ese conjunto para encontrar 20. Luego se le ofrece la oportunidad de cambiar al otro sobre en ese conjunto. Deberías?

Sí, debería cambiar. La ganancia esperada al cambiar a la otra envolvente es [(20-10) + (20-40)] / 2 = +5.

Tenga en cuenta que esta instancia , es decir, saber que encontró 20, y no 10 o 40, se ajusta a las condiciones que describe en su pregunta. Entonces su solución funciona. Pero el experimento en sí no se ajusta a esa descripción. Si había encontrado 10, o si había encontrado 40, la probabilidad de que otro sobre tenga 20 es del 100%. Las ganancias esperadas son +10 y -20, respectivamente. Y si promedia las tres posibles ganancias sobre las probabilidades obtendrá los tres valores, obtendrá 10/4 + 5/2 - 20/4 = 0.


¿Por qué asumiría que un sobre no puede contener 50 centavos? Además, la pregunta es específicamente sobre los momentos en los que no conoce las posibles cantidades que podrían estar en él, solo las posibles cantidades relativas, por lo que realmente no estoy siguiendo esto.
Kitsune Cavalry

Dije que era un enfoque simplista. Comenzó con 'suponga que cada sobre contiene papel moneda estadounidense'. Como no puede tener 50 centavos en papel moneda estadounidense, Pr (E2 = 1) = 1. El punto es que, suponiendo que Y / 2 y 2Y son igualmente probables, cuando no conoce Y, supone una distribución de facto para Y que es imposible de lograr. 2|E1=
JeffJo

0

En general, el problema no se puede resolver porque no ha especificado el procedimiento de aleatorización de todo el experimento.

Pero deje que Y sea el valor del sobre que eligió, y X el otro sobre. La respuesta es entonces , que es una expectativa condicional . Sin embargo, suponiendo una distribución más general de Y, Y se extrae uniformemente de todos . Pero entonces , y según la paradoja de Borel-Kolmogorov, la expectativa es insoluble.E[X|Y=y]R P r ( Y = y ) = 0RPr(Y=y)=0


@JeffJo, no pude comentar bajo tu publicación debido a que no tengo suficiente reputación. Agregué esta respuesta porque creo que está relacionada con tu publicación.
John Rambo
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.