Tira un dado hasta que caiga en cualquier número que no sea 4. ¿Cuál es la probabilidad de que el resultado sea> 4?


20

Un jugador recibe un dado justo de seis lados. Para ganar, debe sacar un número mayor que 4 (es decir, un 5 o un 6). Si saca un 4, debe rodar nuevamente. ¿Cuáles son sus probabilidades de ganar?

Creo que la probabilidad de ganar , puede expresarse recursivamente como:P(W)

P(W)=P(r=5r=6)+P(r=4)P(W)

He aproximada como mediante la ejecución de 1 millón de ensayos en Java, como este:0.3999P(W)0.3999

import java.util.Random;
public class Dice {

    public static void main(String[] args) {
        int runs = 1000000000;
        int wins = 0;
        for (int i = 0; i < runs; i++) {
            wins += playGame();
        }
        System.out.println(wins / (double)runs);
    }

    static Random r = new Random();

    private static int playGame() {
        int roll;
        while ((roll = r.nextInt(6) + 1) == 4);
        return (roll == 5 || roll == 6) ? 1 : 0;
    }
}

Y veo que uno podría expandir así:P(W)

P(W)=13+16(13+16(13+16))...

Pero no sé cómo resolver este tipo de relación de recurrencia sin recurrir a este tipo de aproximación. ¿Es posible?


66
Eso es un gran esfuerzo para establecer la relación de recurrencia. Tienes buenas razones para creer que la respuesta es 0.4. Esa es una fuerte pista de que hay otra forma de pensar en el problema que le da la respuesta directamente. Búscalo. La respuesta de Geomatt lo llevará allí, lo que a su vez lo ayudará a comprender lo que está sucediendo aquí e incluso lo ayudará a simplificar otros problemas que encuentre más rápidamente sin este tipo de esfuerzo. Si un problema aparentemente complicado parece tener una respuesta simple, siempre debe invertir el tiempo para tratar de averiguar por qué. Paga enormes dividendos más tarde.
Joel

8
Una vez que se da cuenta de que debido a las probabilidades iguales de los seis resultados y la independencia de las tiradas, no hay nada especial en ningún resultado particular de este experimento, es obvio que los cinco resultados posibles son igualmente probables.
whuber

66
Estoy un poco decepcionado de que nadie haya presentado la absorbente solución de la Cadena Markov para esto todavía :-) Math Stack Exchange tiene una noble tradición de la "solución excesiva" que rara vez parece permearse en Cross Validated ...
Silverfish

2
Es 2/5 elegir cualquiera de de { 1 , 2 , 3 , 5 , 6 } para que su simulación sea probablemente correcta. {5,6}{1,2,3,5,6}
mathreadler

2
Esta publicación frente a las respuestas es lo que imagino que son los científicos de datos frente a los estadísticos.
bdeonovic

Respuestas:


47

Solo resuélvelo usando álgebra:

P(W)=26+16P(W)56P(W)=26P(W)=25.

2
Tenga en cuenta que este cálculo solo es válido porque la propiedad fuerte de Markov es válida para cadenas discretas de Markov.
Chill2Macht

No recuerdo mis cadenas discretas de Markov, pero me arriesgaría, por matemática simple, que quiere decir que la relación de recurrencia solo es válida debido a la Propiedad de Markov Fuerte. Una vez establecida la relación, solo estamos resolviendo para x.
josinalvo

¿Es esto correcto?
josinalvo

1
@josinalvo: Técnicamente, la pregunta es si P (W) en ambos lados de la ecuación significa lo mismo. La propiedad fuerte de Markov implica que sí. En ausencia de esa propiedad, P (W) en el lado izquierdo significa "la posibilidad de ganar con esta tirada" y 1/6 * P (W) en el derecho significa "la posibilidad de ganar después de sacar un 4".
MSalters

81

Nota: Esta es una respuesta a la pregunta inicial, en lugar de la recurrencia.

Si saca un 4, entonces esencialmente no cuenta, porque el próximo lanzamiento es independiente. En otras palabras, después de sacar un 4, la situación es la misma que cuando comenzó. Entonces puede ignorar el 4. Entonces los resultados que podrían importar son 1-3 y 5-6. Hay 5 resultados distintos, 2 de los cuales están ganando. Entonces la respuesta es 2/5 = 0.4 = 40%.


8
Puedes hacer esto un poco más directo: "Considera el primer lanzamiento que no es un 4. Luego los resultados ..."
Joel

2
Los ojos de la mayoría de las personas se vuelven cuando ven toneladas de matemáticas, así que me gusta más este. Básicamente, está eliminando 4 de los resultados, por lo que es 1, 2, 3, 5, 6. Es obvio que tiene un 40% de posibilidades en ese momento.
Nelson

Pensé esto en el título, por lo que en su mayoría solo leí la pregunta completa después de hacer clic en ella. ¡De lo contrario, probablemente me habría confundido a mí mismo y lo habría adivinado!
GeoMatt22

1
p=a+bp

Sí. La moraleja de la historia es: no intentes hacer que un problema sea más difícil de lo necesario.
Jay

14

Las respuestas de dsaxton ( /stats//a/232107/90759 ) y GeoMatt22 ( /stats//a/232107/90759 ) ofrecen los mejores enfoques para el problema. Otra es darse cuenta de que su expresión

P(W)=13+16(13+16())

Es realmente una progresión geométrica :

13+1613+16213+

En general tenemos

n=0a0qn=a01q

así que aquí tenemos

P(W)=13116=13:56=615=25.

Por supuesto, la forma de probar la fórmula general para la suma de una progresión geométrica es mediante el uso de una solución algebraica similar a dsaxton.


@William, no creo que tu comentario sea apropiado por varias razones. 1. Nunca dije que necesitaras series geométricas para esto. 2. Los conceptos que utiliza en su respuesta son maquinaria mucho más pesada, es irónico decir "¡no necesita series geométricas! Solo necesita la propiedad de Markov fuerte mucho más avanzada y sofisticada". 3. dsaxton ya proporcionó una solución simple y rigurosa. Su método es más indirecto y excesivo para este problema. 4. El OP ya tenía una expresión equivalente a una serie geométrica, alguien tenía que abordar eso, bien podría ser yo.
Meni Rosenfeld

1
@William: en última instancia, su propia respuesta es buena, perspicaz y una adición útil a la colección de respuestas a la pregunta. Eso no significa que deba ir a cualquier otra respuesta y decir que la suya es mucho mejor. Todos están bien también. No todo tiene que abordarse de la manera más abstracta y general posible.
Meni Rosenfeld

Ha pasado un tiempo desde que era estudiante de matemáticas, por lo que me disculpo si mi respuesta carecía de rigor. (Solo no me digas que se basa en el axioma de elección , ¡ya que eso sería humillante!) :)
GeoMatt22

3

Todas las respuestas anteriores son correctas, pero no explican por qué son correctas y por qué puede ignorar tantos detalles y evitar tener que resolver una complicada relación de recurrencia.

La razón por la cual las otras respuestas son correctas es la propiedad Strong Markov , que para una cadena discreta de Markov es equivalente a la propiedad regular de Markov. https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property

Básicamente, la idea es que la variable aleatoria

τ:=(

Es un tiempo de parada . https://en.wikipedia.org/wiki/Stopping_time Un tiempo de detención es una variable aleatoria que no depende de ninguna información futura .

nτ=nτ

τXτ

τ1τXτ>4

P(Xτ>4|τ=1)=P(Xτ>4|τ=2)==P(Xτ>4|τ=50,000,000)=

τ=1

P(X1>4|X4)=P(X1>4X14)P(X14)=P(X1>4)P(X14)=1356=1365=25

Puede leer más sobre los tiempos de parada y la propiedad Strong Markov en la Sección 8.3 de (la 4ta edición de) Teoría y ejemplos de probabilidad de Durrett , p. 365


Por lo que puedo ver en la entrada de la wiki, la existencia de un tiempo de parada es necesaria pero no suficiente para decir que una serie de eventos exhibe el SMP. Lo siento si me falta un chiste o una idea profunda, pero ¿por qué no asumir que los roles son independientes y seguir adelante?
Jacob Raihle

@JacobRaihle "Propiedad de Markov fuerte, que para una cadena de Markov discreta es equivalente a la propiedad de Markov normal". Este escenario constituye claramente una cadena discreta de Markov. Los rollos son independientes, por eso es una cadena discreta de Markov. El problema es que el evento "primer lanzamiento que no aterriza en 4" no es independiente de los lanzamientos anteriores, por razones que son obvias.
Chill2Macht

Está igualmente claro que los rollos son independientes. Entonces, ¿qué beneficio adicional proporciona el SMP?
Jacob Raihle

@JacobRaihle Aunque el valor de las tiradas es independiente, el valor del dado la primera vez que cae en un valor no igual a 4 NO es independiente de los valores en los que el dado cayó en tiradas anteriores.
Chill2Macht

Debería ser así, ya que el rodamiento se detiene tan pronto como eso suceda. No puede haber un rollo que no sea 4 que no sea también el primero. E incluso si ese no fuera el caso, no estoy seguro de qué tipo de relación está sugiriendo.
Jacob Raihle

1

Otra forma de ver el problema.

Llamemos a un 'resultado real' un 1,2,3,5 o 6.

¿Cuál es la probabilidad de ganar en el primer lanzamiento, si obtuviste un 'resultado real'? 2/5

¿Cuál es la probabilidad de ganar en el segundo lanzamiento, si el segundo lanzamiento es la primera vez que obtienes un "resultado real"? 2/5

Lo mismo para el tercero, cuarto.

Por lo tanto, puede dividir su muestra en muestras (infinitas) más pequeñas, y todas esas muestras dan la misma probabilidad.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.