Parece que tu secuencia de observación es B, B. Denotemos la observación en el tiempo como y el estado oculto en el tiempo como . Si denotamos como los valores hacia adelante y como los valores hacia atrás, ( es uno de los posibles estados ocultos)tzttxtαt(i)βt(i)i
αt(i)=P(xt=i,z1:t)
Esto significa que es la probabilidad de llegar al estado en el momento emitiendo las observaciones hasta el tiempo . Entonces,αt(i)itt
βt(i)=P(zt+1:T∣xt=i) que es la probabilidad de emitir la secuencia restante desde hasta el final del tiempo después de estar en estado oculto en el tiempo .t+1it
Para hacer la recursión en podemos escribir,βt(i)
P(zt+1:T∣xt=i)=∑jP(xt+1=j,zt+1:T∣xt=i)
Usando la regla de la cadena,
P(xt+1=j,zt+1:T∣xt=i)=P(zt+2:T,zt+1,xt+1=j∣xt=i)=P(zt+2:T∣zt+1,xt+1=j,xt=i)P(zt+1∣xt+1=j,xt=i)P(xt+1=j∣xt=i)
De las dependencias condicionales de HMM, las probabilidades anteriores se simplifican a
P(zt+2:T∣xt+1=j)P(zt+1∣xt+1=j)P(xt+1=j∣xt=i)
Tenga en cuenta que de nuestra definición.P(zt+2:T∣xt+1=j)=βt+1(j)
Sustituyendo a obtenemos,P(zt+1:T∣xt=i)
βt(i)=P(zt+1:T∣xt=i)=∑jβt+1(j)P(zt+1∣xt+1=j)P(xt+1=j∣xt=i)
Ahora tienes una recursividad para beta. Últimos dos términos de la última ecuación que conoces de tu modelo. Aquí comenzando desde el final de la cadena (T) vamos hacia atrás calculando todo , de ahí el algoritmo hacia atrás. En adelante tienes que comenzar desde el principio y llegar al final de la cadena.βt
En su modelo, debe inicializar para todo . Esta es la probabilidad de no emitir observaciones después de .βT(i)=P(∅∣xT=i)=1iT=2