Asumiendo que sus matrices son algo así como
Pij=Pr[j∣i],Qij=∑t=1N[xt=i&xt+1=j]
entonces podrías interpretar cada fila
i como una distribución multinomial con parámetros
pi=Pi,:,ni=∑j=1KQij
No estoy seguro de que pueda agrupar todas las filas, porque el "número de intentos" variará entre las filas.
Por ejemplo decir K=3 y tus datos son x=[1,1,2,1,2,3,1,2]. Entonces hayN=7 transiciones, con n1=4 procedente de x=1, pero n2=2 desde x=2 y solo y n3=1 desde x=3. Entonces creo que tu confianza enp^1 generalmente debe ser mayor que su confianza en p^3.
(En el caso extremo, tal vez para este ejemplo K Fue en realidad 4, pero no tiene datos en absoluto sobre esas transiciones, como n4=0. Tratar la "ausencia de evidencia como evidencia de ausencia" me parece problemático aquí).
No estoy muy familiarizado con las pruebas de ji cuadrado, pero esto sugiere que es posible que desee tratar las filas de forma independiente (es decir, sumar solo más de j, y use ni más bien que N) Este razonamiento no parece específico de la prueba de ji cuadrado, por lo que también debe aplicarse a cualquier otra prueba de significación que pueda usar (por ejemplo, multinomio exacto ).
La cuestión clave es que las probabilidades de transición son condicionales , por lo que para cada entrada de matriz solo son relevantes las transiciones que satisfacen su condición previa. De hecho, presumiblemente la matriz de transición satisfará∑jPij=1, por lo tanto, la "matriz de transición empírica" debe ser P^ij=Qij/ni.
Actualización: en respuesta a la consulta de OP, una aclaración sobre los "parámetros de prueba".
Si hay K estados en la cadena de Markov, es decir P∈RK×K, luego por fila i, la distribución multinomial correspondiente tendrá un vector de probabilidadpi∈RK y número de ensayos ni∈N, dado anteriormente.
Entonces habrá K categorías y el vector de probabilidad pi tendrá K−1 grados de libertad, como ∑Kj=1(pi)j=1. Entonces para la filai el correspondiente χ2 estadística sería
χ2i=∑j(Qij−niPij)2niPij
que seguirá
asintóticamente un chi-cuadrado distribuido con
K−1grados de libertad (como se indica
aquí y
aquí ). Vea también
aquí para una discusión de cuándo
χ2 la prueba es apropiada y pruebas alternativas que pueden ser más apropiadas.
Se puede ser posible hacer una "prueba agrupados", asumiendoχ2P=∑iχ2i sigue una distribución chi-cuadrado con K(K−1)dof's (es decir, sumando dofs sobre filas). Sin embargo, no estoy seguro de si elχ2iPuede ser tratado como independiente. En cualquier caso, las pruebas en filas parecen ser más informativas, por lo que pueden ser preferibles a una prueba agrupada.