Corre las cadenas en paralelo. Defina tres estados absorbentes en la cadena de productos resultante:
La primera cadena alcanza un estado absorbente pero la segunda no.
La segunda cadena alcanza un estado absorbente pero la primera no.
Ambas cadenas alcanzan simultáneamente un estado absorbente.
Las probabilidades limitantes de estos tres estados en la cadena de productos dan posibilidades de interés.
Esta solución involucra algunas construcciones (simples). Al igual que en la pregunta, dejar que ser una matriz de transición para una cadena . Cuando la cadena está en el estado , da la probabilidad de una transición al estado . Un estado absorbente hace una transición hacia sí mismo con probabilidad .P i P i j j 1P=Pij,1≤i,j≤nPiPijj1
- Cualquier estado puedo ser hecho de absorción sobre la sustitución de la fila P i = ( P i j , j = 1 , 2 , ... , n ) por un vector indicador ( 0 , 0 , ... , 0 , 1 , 0 , ... , 0 ) con un 1 en la posición i .iPi=(Pij,j=1,2,…,n)(0,0,…,0,1,0,…,0)1i
Cualquier conjunto de estados absorbentes puede fusionarse creando una nueva cadena P / A cuyos estados son { iAP/A . La matriz de transición está dada por{i|i∉A}∪{A}
(P/A)ij=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪Pij∑k∈APik01i∉A,j∉Ai∉A,j=Ai=A,j∉Ai=j=A.
Esto equivale a sumar las columnas de correspondientes a y reemplazar las filas correspondientes a por una sola fila que hace una transición hacia sí misma. A APAA
El producto de dos cadenas en los estados y en los estados , con matrices de transición y , respectivamente, es una cadena de Markov en los estados con matriz de transiciónS P Q S Q P Q S P × S Q = { ( p , q )PSPQSQPQSP×SQ={(p,q)|p∈SP,q∈SQ}
(P⊗Q)(i,j),(k,l)=PikQjl.
En efecto, la cadena de productos ejecuta las dos cadenas en paralelo, rastreando por separado dónde está cada una y haciendo transiciones de forma independiente.
Un ejemplo simple puede aclarar estas construcciones. Supongamos que Polly está lanzando una moneda con una probabilidad de que salga cara. Ella planea hacerlo hasta que observe una cabeza. Los estados para el proceso de lanzamiento de monedas son representan los resultados del lanzamiento más reciente: para colas, para caras. Al planear detenerse en la cabeza, Polly aplicará la primera construcción haciendo un estado absorbente. La matriz de transición resultante esS P = { T , H } T H HpSP={T,H}THH
P=(1−p0p1).
Comienza en un estado aleatorio dado por el primer lanzamiento.(1−p,p)
A tiempo con Polly, Quincy lanzará una moneda justa. Planea detenerse una vez que ve dos cabezas seguidas. Su cadena de Markov, por lo tanto, debe realizar un seguimiento del resultado anterior, así como del resultado actual. Hay cuatro combinaciones de dos caras y dos colas, que abreviaré como " ", por ejemplo, donde la primera letra es el resultado anterior y la segunda letra es el resultado actual . Quincy aplica la construcción (1) para hacer un estado absorbente. Después de hacerlo, se da cuenta de que realmente no necesita cuatro estados: puede simplificar su cadena a tres estados: significa que el resultado actual es colas, significa que el resultado actual es cara yHH T H XTHHHTHX significa que los dos últimos resultados fueron dos caras: este es el estado absorbente. La matriz de transición es
Q=⎛⎝⎜⎜1212012000121⎞⎠⎟⎟.
La cadena de productos se ejecuta en seis estados: . La matriz de transición es un producto tensorial de y y se calcula con la misma facilidad. Por ejemplo, es la posibilidad de que Polly haga una transición de a y, en al mismo tiempo (y de forma independiente), Quincy hace una transición de a . El primero tiene una probabilidad de y el segundo una probabilidad de . Debido a que las cadenas se ejecutan independientemente, esas posibilidades se multiplican, dandoP Q ( P ⊗ Q ) ( T , T ) , ( T , H ) T T T H 1 - p 1(T,T),(T,H),(T,X);(H,T),(H,H),(H,X)PQ(P⊗Q)(T,T),(T,H)TTTH1−p( 1 - p ) / 21/2(1−p)/2 . La matriz de transición completa es
P⊗Q=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜1−p21−p200001−p20000001−p21−p000p2p2012120p20012000p2p0121⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟.
Está en forma de matriz de bloques con bloques correspondientes a la segunda matriz :Q
P⊗Q=(P11QP21QP12QP22Q)=((1−p)Q0pQQ).
Polly y Quincy compiten para ver quién logrará su objetivo primero. El ganador será Polly cada vez que se realice una transición a donde no es ; el ganador será Quincy cada vez que se realice una transición a ; y si antes de que cualquiera de estos pueda suceder, se realiza una transición a , el resultado será un empate. Para realizar un seguimiento, haremos que los estados y absorbentes (a través de la construcción (1)) y luego los fusionaremos ( a través de la construcción (2)). La matriz de transición resultante, ordenada por los estados* X ( T , X ) ( H , X ) ( H , T ) ( H , H ) ( T , T ) , ( T , H ) , ( T , X ) , { ( H , T ) , ( H , H ) } , ( H(H,*)*X(T,X)(H,X)(H,T)(H,H)(T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X) es
R=⎛⎝⎜⎜⎜⎜⎜⎜⎜1−p21−p20001−p2000001−p2100pp20100p2001⎞⎠⎟⎟⎟⎟⎟⎟⎟.
Los resultados del primer lanzamiento simultáneo de Polly y Quincy serán los estados con probabilidades , respectivamente: este es el estado inicial en el que se inicia la cadena.(T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X)μ=((1−p)/2,(1−p)/2,0,p,0)
En el límite como ,n→∞
μ⋅Rn→11+4p−p2(0,0,(1−p)2,p(5−p),p(1−p)).
Por lo tanto, las posibilidades relativas de los tres estados absorbentes (que representan a Quincy gana, Polly gana, empatan) son .( 1 - p ) 2 : p ( 5 - p ) : p ( 1 - p )(T,X),{(H,T),(H,H)},(H,X)(1−p)2:p(5−p):p(1−p)
En función de (la posibilidad de que cualquiera de los lanzamientos de Polly sea cara), la curva roja traza la posibilidad de Polly de ganar, la curva azul traza la posibilidad de Quincy de ganar y la curva dorada traza la posibilidad de un empate.p