Si lo he entendido correctamente, entonces el problema es encontrar una distribución de probabilidad para el momento en que termina la primera ejecución de o más cabezas.n
Editar Las probabilidades se pueden determinar con precisión y rapidez utilizando la multiplicación de matrices, y también es posible calcular analíticamente la media como y la varianza como where , pero probablemente no haya una forma cerrada simple para la distribución en sí. Por encima de cierto número de lanzamientos de monedas, la distribución es esencialmente una distribución geométrica: tendría sentido usar esta forma para más grande .σ 2 = 2 n + 2 ( μ - n - 3 ) - μ 2 + 5 μ μ = μ - + 1 tμ−=2n+1−1σ2=2n+2(μ−n−3)−μ2+5μμ=μ−+1t
La evolución en el tiempo de la distribución de probabilidad en el espacio de estados puede modelarse utilizando una matriz de transición para estados, donde el número de lanzamientos consecutivos de monedas. Los estados son los siguientes:n =k=n+2n=
- Estado , sin cabezasH0
- Estado , heads, i 1 ≤ i ≤ ( n - 1 )Hii1≤i≤(n−1)
- Estado , o más cabezas nHnn
- Indique , o más cabezas seguidas de una cola nH∗n
Una vez que al estado no puede regresar a ninguno de los otros estados.H∗
Las probabilidades de transición de estado para ingresar a los estados son las siguientes
- Estado : probabilidad de , , es decir, incluyéndose a sí mismo pero no el estado1H0 Hii=0,…,n-1Hn12Hii=0,…,n−1Hn
- Estado : probabilidad de1Hi Hi-112Hi−1
- Estado : probabilidad de , es decir, del estado con cabezas y sí mismo1Hn Hn-1,Hnn-112Hn−1,Hnn−1
- Estado : probabilidad de y probabilidad 1 de (sí mismo)1H∗ HnH∗12HnH∗
Entonces, por ejemplo, para , esto da la matriz de transiciónn=4
X=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪H0H1H2H3H4H∗H012120000H112012000H212001200H312000120H400001212H∗000001⎫⎭⎬⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪
Para el caso , el vector inicial de probabilidades p es p = ( 1 , 0 , 0 , 0 , 0 , 0 ) . En general, el vector inicial tiene
p i = { 1 i = 0 0 i > 0n = 4pagp =(1,0,0,0,0,0)
pagyo= { 10 0i = 0i > 0
El vector es la distribución de probabilidad en el espacio para cualquier momento dado. El cdf requerido es un cdf en el tiempo , y es la probabilidad de haber visto al menos n monedas al final del tiempo t . Se puede escribir como ( X t + 1 p ) k , observando que alcanzamos el estado H ∗ 1 veces después del último en la serie de lanzamientos consecutivos de monedas.pagnortet( Xt + 1p )kH∗
El pmf requerido en el tiempo se puede escribir como . Sin embargo, numéricamente esto implica quitar un número muy pequeño de un número mucho mayor ( ≈ 1 ) y restringe la precisión. Por lo tanto, en los cálculos es mejor establecer X k , k = 0 en lugar de 1. Luego, escribir X ′ para la matriz resultante X ′ = X | X k , k = 0( Xt + 1p )k- ( Xtp )k≈ 1Xk , k= 0X′X′= XEl | Xk , k= 0, el pmf es . Esto es lo que se implementa en el programa R simple a continuación, que funciona para cualquier n ≥ 2 ,( X′ T + 1p )kn ≥ 2
n=4
k=n+2
X=matrix(c(rep(1,n),0,0, # first row
rep(c(1,rep(0,k)),n-2), # to half-way thru penultimate row
1,rep(0,k),1,1,rep(0,k-1),1,0), # replace 0 by 2 for cdf
byrow=T,nrow=k)/2
X
t=10000
pt=rep(0,t) # probability at time t
pv=c(1,rep(0,k-1)) # probability vector
for(i in 1:(t+1)) {
#pvk=pv[k]; # if calculating via cdf
pv = X %*% pv;
#pt[i-1]=pv[k]-pvk # if calculating via cdf
pt[i-1]=pv[k] # if calculating pmf
}
m=sum((1:t)*pt)
v=sum((1:t)^2*pt)-m^2
c(m, v)
par(mfrow=c(3,1))
plot(pt[1:100],type="l")
plot(pt[10:110],type="l")
plot(pt[1010:1110],type="l")
La gráfica superior muestra el pmf entre 0 y 100. Las dos gráficas inferiores muestran el pmf entre 10 y 110 y también entre 1010 y 1110, ilustrando la autosimilitud y el hecho de que, como dice @Glen_b, la distribución parece que puede ser aproximado por una distribución geométrica después de un período de asentamiento.
Es posible investigar este comportamiento aún más el uso de un vector propio de la descomposición . Hacerlo muestra que para t suficientemente grande , p t + 1 ≈ c ( n ) p t , donde c ( n ) es la solución de la ecuación 2 n + 1 c n ( c - 1 ) + 1 = 0 . Esta aproximación mejora con el aumento de ny es excelente para tXtpagt + 1≈ c ( n ) ptc ( n )2n + 1Cnorte( c - 1 ) + 1 = 0norteten el rango de aproximadamente 30 a 50, dependiendo del valor de , como se muestra en la gráfica de error de registro a continuación para calcular p 100 (colores del arco iris, rojo a la izquierda para n = 2 ). (De hecho, por razones numéricas, en realidad sería mejor usar la aproximación geométrica para las probabilidades cuando t es mayor).nortepag100n = 2t
Sospecho (ed) que puede haber una forma cerrada disponible para la distribución porque las medias y las variaciones como las he calculado de la siguiente manera
norte234 45 56 67 789 910Media7 715316312725551110232047Diferencia241447363392147206169625344010291204151296
(Tuve que aumentar el número en el horizonte de tiempo t=100000
para obtener esto, pero el programa todavía se ejecutó para todos en menos de aproximadamente 10 segundos). Las medias en particular siguen un patrón muy obvio; las variaciones no tanto. He resuelto un sistema de transición de 3 estados más simple en el pasado, pero hasta ahora no tengo suerte con una solución analítica simple para este. Tal vez hay alguna teoría útil que no conozco, por ejemplo, en relación con las matrices de transición.n = 2 , ... , 10
Editar : después de muchos comienzos falsos se me ocurrió una fórmula de recurrencia. Sea la probabilidad de estar en el estado H i en el tiempo t . Sea q ∗ , t la probabilidad acumulada de estar en el estado H ∗ , es decir, el estado final, en el tiempo t . nótese bienpagi , tHyotq∗ , tH∗t
- Para cualquier dado , p i , t , 0 ≤ i ≤ n y q * , t son una distribución de probabilidad sobre el espacio i , e inmediatamente debajo de uso el hecho de que sus probabilidades se suman a 1.tpagi , t, 0 ≤ i ≤ nq∗ , tyo
- forman una distribución de probabilidad en el tiempo t . Más tarde, uso este hecho para derivar los medios y las variaciones.pag∗ , tt
La probabilidad de estar en el primer estado en el tiempo , es decir, sin cabezas, viene dada por las probabilidades de transición de los estados que pueden volver a ella desde el tiempo t (usando el teorema de la probabilidad total).
p 0 , t + 1t + 1t
Pero para pasar del estadoH0aHn-1 serequierenn-1pasos, de ahí quepn-1,t+n-1=1
pag0 , t + 1= 12pag0 , t+ 12pag1 , t+ … 12pagn - 1 , t= 12∑i = 0n - 1pagi,t=12(1−pn,t−q∗,t)
H0 0Hn - 1n - 1y
pn-1,t+n=1pagn - 1 , t + n - 1= 12n - 1pag0 , t
Una vez más, según el teorema de la probabilidad total, la probabilidad de estar en el estado
Hnen el tiempo
t+1es
p n , t + 1pagn - 1 , t + n= 12norte( 1 - pn , t- q∗ , t)
Hnortet + 1
y usando el hecho de que
q∗,t+1-q∗,t=1pagn , t + 1= 12pagn , t+ 12pagn - 1 , t= 12pagn , t+ 12n + 1( 1 - pn , t - n- q∗ , t - n)( † )
,
2 q ∗ , t + 2 - 2 q ∗ , t + 1q∗ , t + 1- q∗ , t= 12pagn , t⟹pagn , t= 2 q∗ , t + 1- 2 q∗ , t
Por lo tanto, cambiando
t→t+n,
2q∗,t+n+2-3q∗,t+n+1+q∗,t+n+12 q∗ , t + 2- 2 q∗ , t + 1= q∗ , t + 1- q∗ , t+ 12n + 1( 1 - 2 q∗ , t - n + 1+ q∗ , t - n)
t → t + n2 q∗ , t + n + 2- 3 q∗ , t + n + 1+ q∗ , t + n+ 12norteq∗ , t + 1- 12n + 1q∗ , t- 12n + 1= 0
n = 4n = 6n = 6t=1:994;v=2*q[t+8]-3*q[t+7]+q[t+6]+q[t+1]/2**6-q[t]/2**7-1/2**7
Editar No puedo ver a dónde ir para encontrar un formulario cerrado a partir de esta relación de recurrencia. Sin embargo, es posible obtener una forma cerrada para la media.
( † )pag∗ , t + 1= 12pagn , t
pagn , t + 12n + 1( 2 p∗ , t + n + 2- p∗ , t + n + 1) +2 p∗ , t + 1= 12pagn , t+ 12n + 1( 1 - pn , t - n- q∗ , t - n)( † )= 1 - q∗ , t
t = 0∞mi[ X] = ∑∞x = 0( 1 - F( x ) )pag∗ , t2n + 1∑t = 0∞( 2 p∗ , t + n + 2- p∗ , t + n + 1) +2 ∑t = 0∞pag∗ , t + 12n + 1( 2 ( 1 - 12n + 1) -1) +22n + 1= ∑t = 0∞( 1 - q∗ , t)= μ= μ
H∗
mi[ X2] = ∑∞x = 0( 2 x + 1 ) ( 1 - F( x ) )
∑t = 0∞( 2 t + 1 ) ( 2n + 1( 2 p∗ , t + n + 2- p∗ , t + n + 1) +2 p∗ , t + 1)2 ∑t = 0∞t ( 2n + 1( 2 p∗ , t + n + 2- p∗ , t + n + 1) +2 p∗ , t + 1) +μ2n + 2( 2 ( μ - ( n + 2 ) + 12n + 1) -(μ-(n+1)) ) +4(μ-1)+ μ2n + 2( 2 ( μ - ( n + 2 ) ) - ( μ - ( n + 1 ) ) ) + 5 μ2n + 2( μ - n - 3 ) + 5 μ2n + 2( μ - n - 3 ) - μ2+ 5 μ= ∑t = 0∞( 2 t + 1 ) ( 1 - q∗ , t)= σ2+ μ2= σ2+ μ2= σ2+ μ2= σ2+ μ2= σ2
Los medios y las variaciones se pueden generar fácilmente mediante programación. Por ejemplo, para verificar las medias y las variaciones de la tabla anterior, utilice
n=2:10
m=c(0,2**(n+1))
v=2**(n+2)*(m[n]-n-3) + 5*m[n] - m[n]^2
Finalmente, no estoy seguro de lo que querías cuando escribiste
cuando una cola golpea y rompe la racha de cabezas, el conteo comenzaría nuevamente desde el siguiente giro.
nortenorte
μ - 1μ + 1Xk , k ,= 0X1 , k= 1H0 0H∗n = 4
H0 0H1H2H3H4 4H∗probabilidad0.484848480.242424240.121212120.060606060.060606060.03030303
H∗= 1 / 0.03030303 = 33 = μ + 1
Apéndice : programa Python utilizado para generar probabilidades exactas para n
= número de N
caras consecutivas sobre lanzamientos.
import itertools, pylab
def countinlist(n, N):
count = [0] * N
sub = 'h'*n+'t'
for string in itertools.imap(''.join, itertools.product('ht', repeat=N+1)):
f = string.find(sub)
if (f>=0):
f = f + n -1 # don't count t, and index in count from zero
count[f] = count[f] +1
# uncomment the following line to print all matches
# print "found at", f+1, "in", string
return count, 1/float((2**(N+1)))
n = 4
N = 24
counts, probperevent = countinlist(n,N)
probs = [count*probperevent for count in counts]
for i in range(N):
print '{0:2d} {1:.10f}'.format(i+1,probs[i])
pylab.title('Probabilities of getting {0} consecutive heads in {1} tosses'.format(n, N))
pylab.xlabel('toss')
pylab.ylabel('probability')
pylab.plot(range(1,(N+1)), probs, 'o')
pylab.show()