Sea el conjunto de secuencias de sumas parciales de las tiradas de dados (con cada secuencia comenzando en ). Para cualquier número entero , sea el evento de que aparece en una secuencia; es decir,Ω0nEnn
En={ω∈Ω|n∈ω}.
Definir para ser el primer valor de que es igual o superior . La pregunta pide propiedades de . Podemos obtener la distribución exacta de , y de ahí todo se deduce.XM(ω)ωMXM−MXM
Primero, observe que . Al dividir el evento acuerdo con el valor inmediatamente anterior en , y dejando que sea la probabilidad de observar la cara en una tirada del dado ( ), se deduce queX M - M = k ω p ( i ) = 1 / 6 i i = 1 , 2 , 3 , 4 , 5 , 6XM(ω)−M∈{0,1,2,3,4,5}XM−M=kωp(i)=1/6ii=1,2,3,4,5,6
Pr(XM−M=k)=∑j=k6Pr(EM+k−j)p(j)=16∑j=k6Pr(EM+k−j).
En este punto, podríamos argumentar heurísticamente que, con una muy buena aproximación para todos menos el ,Esto se debe a que el valor esperado de una tirada es y su recíproco debe ser la frecuencia limitante y estable a largo plazo de cualquier valor particular en .M
Pr(Ei)≈2/7.
(1+2+3+4+5+6)/6=7/2ω
Una forma rigurosa de demostrar esto considera cómo podría ocurrir . O ocurre y la tirada posterior fue un ; o se produce y la tirada posterior fue un ; o ... o ocurre y la tirada posterior fue un . Esta es una partición exhaustiva de las posibilidades, de dondeEiEi−11Ei−22Ei−66
Pr(Ei)=∑j=16Pr(Ei−j)p(j)=16∑j=16Pr(Ei−j).
Los valores iniciales de esta secuencia son
Pr(E0)=1;Pr(E−i)=0,i=1,2,3,….
Esta gráfica de contra muestra la rapidez con que las posibilidades se asientan a un constante , que se muestra mediante la línea de puntos horizontal.Pr(Ei)i2/7
Existe una teoría estándar de tales secuencias recursivas. Puede desarrollarse mediante funciones generadoras, cadenas de Markov o incluso manipulación algebraica. El resultado general es que existe una fórmula de forma cerrada para . Pr(Ei) Será una combinación lineal de una constante y los poderes de las raíces del polinomioith
x6−p(1)x5−p(2)x4−p(3)x3⋯−p(6)=x6−(x5+x4+x3+x2+x+1)/6.
La mayor magnitud de estas raíces es aproximadamente . En una representación de coma flotante de doble precisión, es esencialmente cero. Por lo tanto, para , podemos ignorar completamente todos menos la constante. Esta constante es .exp(−0.314368)exp(−36.05)i≫−36.05/−0.314368=1152/7
En consecuencia, para , a todos los efectos prácticos, podemos tomar , de dondeM=300≫115EM+k−j=2/7
Pr(XM−M=(0,1,2,3,4,5))=(27)(16)(6,5,4,3,2,1).
Calcular la media y la varianza de esta distribución es sencillo y sencillo.
Aquí hay una R
simulación para confirmar estas conclusiones. Genera casi 100,000 secuencias a través de , tabula los valores de y aplica una para evaluar si los resultados son consistentes con lo anterior. El valor p (en este caso) de es lo suficientemente grande como para indicar que son consistentes.M+5=305X300−300χ20.1367
M <- 300
n.iter <- 1e5
set.seed(17)
n <- ceiling((2/7) * (M + 3*sqrt(M)))
dice <- matrix(ceiling(6*runif(n*n.iter)), n, n.iter)
omega <- apply(dice, 2, cumsum)
omega <- omega[, apply(omega, 2, max) >= M+5]
omega[omega < M] <- NA
x <- apply(omega, 2, min, na.rm=TRUE)
count <- tabulate(x)[0:5+M]
(cbind(count, expected=round((2/7) * (6:1)/6 * length(x), 1)))
chisq.test(count, p=(2/7) * (6:1)/6)
[self-study]
etiqueta y lea su wiki . Luego díganos qué ha entendido hasta ahora, qué ha intentado y dónde está atrapado. Le proporcionaremos sugerencias para ayudarlo a despegarse.