El valor esperado de la variable aleatoria en el lanzamiento de una moneda.


8

Encontré un problema interesante hoy. Te dan una moneda y x dinero, doblas dinero si obtienes cara y pierdes la mitad si sale cruz en cualquier lanzamiento.

  1. ¿Cuál es el valor esperado de su dinero en n intentos?
  2. ¿Cuál es la probabilidad de obtener un valor superior al esperado en (1)

Así es como lo enfoqué. La probabilidad de cara y cruz es la misma (1/2). Valor esperado después del primer lanzamiento = Entonces el valor esperado es después del primer lanzamiento. De manera similar, repetir la expectativa del segundo lanzamiento en 5x / 4, valor esperado después del segundo lanzamiento =1/2(2x)+1/2(1/2x)=5x/45x/41/2(25x/4)+1/2(1/25x/4)=25x/16

Entonces obtienes una secuencia de valores esperados: , , , ...25 x / 16 125 x / 645x/425x/16125x/64

Después de intentos, su valor esperado debe ser .( 5 n / 4 n ) xn(5n/4n)x

Si es lo suficientemente grande, su valor esperado debería acercarse a la media de la distribución. Entonces, la probabilidad de que el valor sea mayor que el valor esperado debería ser . No estoy seguro de esto.0.5n0.5


1
La probabilidad de observar un valor por encima de la mediana es la mitad, pero su cantidad se distribuye normalmente por log para n grande, que tiene una media y una mediana diferentes, por lo que no debe esperar que esa probabilidad se acerque a 1/2.
Yaroslav Bulatov

Respuestas:


9

Si n es lo suficientemente grande, su valor esperado debería acercarse a la media de la distribución.

Si eso es correcto.

Entonces, la probabilidad de que el valor sea mayor que el valor esperado debería ser 0.5.

Esto solo sería correcto si la distribución es simétrica, lo que en tu juego no es el caso. Puedes ver esto fácilmente si piensas cuál debería ser el valor medio de tus ganancias después de tiros.n


Puedes pensar en tu problema como una caminata aleatoria . Una caminata aleatoria unidimensional básica es una caminata en la línea real entera, donde en cada punto nos movemos con probabilidad . Esto es exactamente lo que tiene si ignoramos la duplicación / reducción a la mitad del dinero y establecemos . Todo lo que tenemos que hacer es reasignar su sistema de coordenadas a este ejemplo. Deje que sea ​​su bote inicial. Luego reasignamos de la siguiente manera:p p = 0,5 x±1pp=0.5x

x*2^{-2} = -2
x*2^{-1} = -1 
  x = 0
 x*2 = 1  

es decir, . Deje que denote cuánto dinero hemos ganado del juego después de turnos, luegoS n n2kx=kSnn

Pr(Sn=2kx)=2n(n(n+k)/2)
para .n(n+k)/20

Cuando no es un múltiplo de 2, entonces . Para entender esto, asuma que comenzamos con £ 10. Después de turnos, los únicos valores posibles son £ 5 o £ 20, es decir, o .P r ( S n ) = 0 n = 1 k = - 1 k = 1(n+k)Pr(Sn)=0n=1k=1k=1

El resultado anterior es un resultado estándar de caminatas aleatorias. Paseos aleatorios de Google para obtener más información. También a partir de la teoría de la caminata aleatoria, podemos calcular el retorno medio para que sea , que no es lo mismo que el valor esperado.x

Nota: he asumido que siempre puedes la mitad de tu dinero. Por ejemplo, se permiten 1 peniques, 0,5 peniques, 0,25 peniques. Si elimina esta suposición, entonces tiene una caminata aleatoria con una pared absorbente.


Por completitud

Aquí hay una simulación rápida en R de su proceso:

#Simulate 10 throws with a starting amount of x=money=10
#n=10
simulate = function(){
  #money won/lost in a single game
  money = 10
  for(i in 1:10){
    if(runif(1) < 0.5)
      money = money/2
    else
      money = 2*money
  }
  return(money)
}

#The Money vector keeps track of all the games
#N is the number of games we play
N = 1000
Money = numeric(N)
for(i in 1:N)
  Money[i]= simulate()

mean(Money);median(Money)
#Probabilities
#Simulated
table(Money)/1000
#Exact
2^{-10}*choose(10,10/2)

#Plot the simulations
plot(Money)

Debido a que (n + k) / 2 no es necesariamente integral, considere reescribir la probabilidad como Pr (S_n = 2 ^ {2k-n}) = 2 ^ -n Comb (n, k), 0 <= k <= n. (También hay algo sospechoso en que equivale a 2 ^ kx = k.)
whuber

debe su variable de moneyser x?
Jeromy Anglim

@ Jeromy: Sí, lo he cambiado. @whuber: Tienes razón, he tratado de aclarar un poco la probabilidad. Por cierto, integral-> entero en su comentario.
csgillespie

1

Deje que sea ​​la riqueza después de jugadas de este juego, donde asumimos La tentación aquí es tomar , y estudiar como una caminata simétrica aleatoria, con innovaciones de tamaño . Resulta que esto estará bien para la segunda pregunta, pero no para la primera. Un poco de trabajo mostrará que, asintóticamente, tenemos . A partir de esto, no se puede concluir que es asintóticamente log normalmente distribuido conSkkS0=1.Xk=logSkXk±log2XkN(0,k(log2)2)Skμ=0,σ=log2k.La operación de registro no conmuta con el límite. Si lo hiciera, obtendría el valor esperado de como , que es casi correcto, pero no del todo.Skexp(klog2log2/2)

Sin embargo, este método está bien para encontrar cuantiles de y otras preguntas de probabilidad, como la pregunta (2). TenemosLa cantidad en el lado izquierdo de la última desigualdad es, asintóticamente, una normal estándar, por lo que la probabilidad de que exceda su media se aproxima a donde es el CDF del estándar normal. Esto se acerca a cero con bastante rapidez.SkSk(54)kXkklog(5/4)Xk/klog2klog(5/4)/log2.Sk1Φ(klog(5/4)/log2),Φ

Código de Matlab para verificar esto:

top_k = 512;
nsamps = 8192;
innovs = log(2) * cumsum(sign(randn(top_k,nsamps)),1);
s_k = exp(innovs);
k_vals = (1:top_k)';
mean_v = (5/4) .^ k_vals;
exceed = bsxfun(@ge,s_k,mean_v);
prob_g = mean(double(exceed),2);

%theoretical value
%(can you believe matlab doesn't come with normal cdf function!?)
nrmcdf = @(x)((1 + erf(x / sqrt(2)))/2);
p_thry = 1 - nrmcdf(sqrt(k_vals) * log(5/4) / log(2));

loglog(k_vals,prob_g,'b-',k_vals,p_thry,'r-');
legend('empirical probability','theoretical probability');

El gráfico producido: texto alternativo


-1

Tienes razón sobre la expectativa.

En realidad, también tiene la respuesta correcta a la probabilidad de recuperar más que su apuesta original, aunque no es la prueba correcta. Considere, en lugar de la cantidad bruta de dinero que tiene, su logaritmo de base 2. Esto resulta ser la cantidad de veces que ha duplicado su dinero, menos la cantidad de veces que lo ha reducido a la mitad. Esta es la suma de variables aleatorias independientes, cada una igual a o con probabilidad . La probabilidad que desea es la probabilidad de que esto sea positivo. Si es impar, entonces por simetría es exactamente ; si es par ( ) entonces es n + 1 - 1 1 / 2 n 1 / 2 n 2 k 1 / 2 S n = 0 P ( S 2 k = 0 ) = ( 2 kSnn+111/2n1/2n2k1/2menos la mitad de la probabilidad de que . Pero , que se acerca a como .Sn=00kP(S2k=0)=(2kk)/22k0k


Esta demostración parece suponer que la cantidad de dinero esperada es cero, pero no lo es. Además, parece suponer que la red de duplicaciones menos mitades debe ser no negativa, lo que también es incorrecto. Colectivamente, estos errores producen el límite correcto, pero eso es un accidente.
whuber
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.