Sea un camino de la cadena de Markov y deje que sea la probabilidad de observar el camino cuando es el verdadero valor del parámetro (también conocido como la función de probabilidad para ). Usando la definición de probabilidad condicional, sabemos{Xi}Ti=1Pθ(X1,...,XT)θθ
Pθ(X1,...,XT)=Pθ(XT|XT−1,...,X1)⋅Pθ(X1,...,XT−1)
Como se trata de una cadena de Markov, sabemos que , así que esto simplifica esto aPθ(XT|XT−1,...,X1)=Pθ(XT|XT−1)
Pθ(X1,...,XT)=Pθ(XT|XT−1)⋅Pθ(X1,...,XT−1)
Ahora, si repites esta misma lógica veces, obtienesT
Pθ(X1,...,XT)=∏i=1TPθ(Xi|Xi−1)
donde debe interpretarse como el estado inicial del proceso. Los términos en el lado derecho son solo elementos de la matriz de transición. Dado que fue la probabilidad de registro que solicitó, la respuesta final es:X0
L(θ)=∑i=1Tlog(Pθ(Xi|Xi−1))
Esta es la probabilidad de una sola cadena de Markov: si su conjunto de datos incluye varias cadenas de Markov (independientes), entonces la probabilidad completa será una suma de términos de este formulario.