Verifique la propiedad sin memoria de una cadena de Markov


17

Sospecho que una serie de secuencias observadas son una cadena de Markov ...

X=(ACDDBACBAACADABCADABE)

Sin embargo, ¿cómo podría verificar que realmente respetan la propiedad sin memoria de

P(Xi=xi|Xj=xj)?

¿O al menos demostrar que son de naturaleza Markov? Tenga en cuenta que estas son secuencias observadas empíricamente. ¿Alguna idea?

EDITAR

Solo para agregar, el objetivo es comparar un conjunto predicho de secuencia de los observados. Por lo tanto, apreciaríamos los comentarios sobre la mejor manera de compararlos.

Matriz de transición de primer orden

Mij=xijmxik
donde m = A..E indica

M=(0.18340.30770.07690.14790.28400.46970.11360.00760.25000.15910.18270.24040.22120.19230.16350.23780.18180.06290.33570.18180.24580.17880.11730.17880.2793)

Valores propios de M

E=(1.0000000000.2283000000.1344000000.11360.0430i000000.1136+0.0430i)

Vectores propios de M

V=(0.44720.58520.42190.23430.0421i0.2343+0.0421i0.44720.78380.42110.44790.2723i0.4479+0.2723i0.44720.20060.37250.63230.63230.44720.00100.70890.21230.0908i0.2123+0.0908i0.44720.05400.05890.2546+0.3881i0.25460.3881i)

¿Las columnas contienen la serie y las filas los elementos de las secuencias? ¿Cuál es el número observado de filas y columnas?
mpiktas


@mpiktas Las filas representan las secuencias independientes observadas de transiciones a través de los estados AD. Hay unas 400 secuencias ... Tenga en cuenta que las secuencias observadas no son todas de la misma longitud. De hecho, la matriz anterior en muchos casos está aumentada por ceros. Gracias por el enlace por cierto. Parece que todavía hay mucho espacio para trabajar en este campo. ¿Tienes alguna otra idea? Saludos,
HCAI

1
La regresión lineal fue un ejemplo para fortalecer el punto de mi argumento. Es decir, es posible que no necesite probar la propiedad de Markov directamente, solo necesita ajustar un módem que asume la propiedad de Markov y luego verificar la validez del modelo.
mpiktas

1
Recuerdo vagamente que he visto en alguna parte una prueba de hipótesis para H0 = {Markov} vs H1 = {Markov orden 2}. Esto podria ayudar.
Stéphane Laurent

Respuestas:


5

Me pregunto si lo siguiente daría una prueba válida de Pearson para las proporciones de la siguiente manera.χ2

  1. Calcule las probabilidades de transición de un paso: ya lo hizo.
  2. Obtener las probabilidades del modelo de dos
    p^U,V=Prob[Xi+2=U|Xi=V]=W{A,B,C,D}Prob[Xi+2=U|Xi+1=W]Prob[Xi+1=W|Xi=V]
  3. Obtenga las probabilidades empíricas de dos pasos
    p~U,V=i#Xi=V,Xi+2=Ui#Xi=V
  4. Forma Pearson prueba estadística
    TV=#{Xi=V}U(p^U,Vp~U,V)2p^U,V,T=TA+TB+TC+TD

Es tentador para mí pensar que cada , de modo que el total T χ 2 12 . Sin embargo, no estoy completamente seguro de eso, y agradecería sus pensamientos al respecto. No no soy asimismo sertain co acerca de si hay que ser paranoico acerca de la independencia, y sin querer dividir la muestra en dos mitades para estimar p y ˉ p .TUχ32Tχ122p^p¯


¿Las probabilidades no tienen que tener una distribución normal con media 0 y varianza = 1 para que esto se mantenga? Me interesaría mucho saber qué piensa alguien aquí.
HCAI

Eso es lo que se supone que son los términos en la suma, asintóticamente con grandes recuentos.
StasK

6

La propiedad de Markov puede ser difícil de probar directamente. Pero podría ser suficiente para ajustarse a un modelo que asume la propiedad de Markov y luego probar si el modelo cumple. Puede resultar que el modelo ajustado sea una buena aproximación que sea útil para usted en la práctica, y no debe preocuparse si la propiedad de Markov realmente es válida o no.

El paralelo se puede dibujar a la regresión lineal. La práctica habitual no es probar si la linealidad es válida, sino si el modelo lineal es una aproximación útil.


Esta parece ser la mejor opción en realidad, solo que en realidad no puedo comparar un modelo lineal con ningún dato experimental real. ¿O tenías algo más en mente?
HCAI

6

Para concretar la sugerencia de la respuesta anterior, primero debe estimar las probabilidades de Markov, suponiendo que sea Markov. Vea la respuesta aquí Estimación de las probabilidades de la cadena de Markov

Usted debe obtener una matriz de 4 x 4 en base a la proporción de las transiciones de un estado A a A, de A a B, etc. Llame a esta matriz . M 2 debería ser la matriz de transición de dos pasos: A a A en 2 pasos, y así sucesivamente. Luego puede probar si su matriz de transición de 2 pasos observada es similar a M 2 .MM2M2

Como tiene muchos datos para la cantidad de estados, puede estimar partir de la mitad de los datos y probar M 2 utilizando la otra mitad; está probando las frecuencias observadas contra las probabilidades teóricas de un multinomio. Eso debería darte una idea de qué tan lejos estás.MM2

Otra posibilidad sería ver si las proporciones básicas del estado: proporción del tiempo pasado en A, tiempo pasado en B, coincide con el vector propio del valor propio de la unidad de M. Si su serie ha alcanzado algún tipo de estado estable, la proporción de tiempo en cada El estado debe tender a ese límite.


Hay un poco que ver allí. He calculado la matriz de transición , pero no estoy seguro de cómo calcularías el M 2 empíricamente. ¿Podría aclarar ese punto? Saludos,MM2
HCAI

Además, el último comentario es muy interesante, aunque no tengo el tiempo dedicado a cada estado de mis secuencias observadas. Solo tengo el tiempo total para cada fila. Entonces eso puede limitar la aplicabilidad de ese método. ¿Cuáles son tus pensamientos?
HCAI

1
Hazlo de la misma manera que hiciste M, solo que en lugar de mirar las transiciones vecinas más cercanas (por ejemplo, las secuencias AB), mira los pares que están separados por 2. Entonces, si un sujeto se convierte en ACB, eso cuenta para su conteo de transición AB. También lo hace ABB. Cree una matriz donde el elemento en la fila i, la columna j contiene las transiciones i a j. Luego divida por los totales de la columna. Desea que las columnas sumen 1. Bajo la propiedad Markov, esta matriz debe estar cerca de M2
Placidia

RE: equilibrio. Asumí que las transiciones ocurren en momentos determinados; digamos que cada segundo, usted pasa del estado actual al siguiente. Puede tomar la frecuencia de los estados A, B, C y D cerca de los extremos de las secuencias, o a través de secuencias para estimar el comportamiento límite.
Placidia

En R, si hace eigen (M), debe obtener los valores propios y los vectores propios de M. Un valor propio será 1. El vector propio correspondiente debe ser proporcional a sus proporciones de estado estacionario ... si es Markov.
Placidia

2

Más allá de la propiedad de Markov (MP), otra propiedad es la homogeneidad del tiempo (TH): puede ser Markov pero con su matriz de transición P ( t ) dependiendo del tiempo t . Por ejemplo, puede depender del día de la semana en t si las observaciones son diarias, y luego una dependencia X t de X t - 7 condicional en X t - 1 puede diagnosticarse si TH se asume indebidamente.XtP(t)ttXtXt7Xt1

Suponiendo que TH se cumple, una posible verificación para MP es probar que es independiente de X t - 2 condicional a X t - 1 , como sugirieron Michael Chernick y StasK. Esto se puede hacer usando una prueba para la tabla de contingencia. Podemos construir las n tablas de contingencia de X t y X t - 2 condicionadas a { X t - 1 = x j } para los n valores posibles x jXtXt2Xt1nXtXt2{Xt1=xj}nxjy prueba de independencia. Esto también se puede hacer usando con > 1 en lugar de X t - 2 .Xt>1Xt2

En R, tablas de contingencia o matrices se producen fácilmente gracias al factor de instalaciones y las funciones apply, sweep. La idea anterior también se puede explotar gráficamente. Los paquetes ggplot2 o retícula proporcionan fácilmente gráficos condicionales para comparar distribuciones condicionales . Por ejemplo, establecer i como índice de fila y jp(Xt|Xt1=xj,Xt2=xi)ij como el índice de columna en enrejado debería bajo MP conducir a distribuciones similares dentro de una columna.

El cap. 5 del libro El análisis estadístico de los procesos estocásticos en el tiempo por JK Lindsey contiene otras ideas para verificar los supuestos.

enter image description here

[## simulates a MC with transition matrix in 'trans', starting from 'ini'
simMC <- function(trans, ini = 1, N) {
  X <- rep(NA, N)
  Pcum <- t(apply(trans, 1, cumsum))
  X[1] <- ini 
  for (t in 2:N) {
    U <- runif(1)
    X[t] <- findInterval(U, Pcum[X[t-1], ]) + 1
  }
  X
}
set.seed(1234)
## transition matrix
P <- matrix(c(0.1, 0.1, 0.1, 0.7,
              0.1, 0.1, 0.6, 0.2,
              0.1, 0.3, 0.2, 0.4,
              0.2, 0.2, 0.3, 0.3),
            nrow = 4, ncol = 4, byrow = TRUE)
N <- 2000
X <- simMC(trans = P, ini = 1, N = N)
## it is better to work with factors
X <- as.factor(X)
levels(X) <- LETTERS[1:4]
## table transitions and normalize each row
Phat <- table(X[1:(N-1)], X[2:N])
Phat <- sweep(x = Phat, MARGIN = 1, STATS = apply(Phat, 1, sum), FUN = "/")
## explicit dimnames
dimnames(Phat) <- lapply(list("X(t-1)=" ,"X(t)="),
                         paste, sep = "", levels(as.factor(X)))
## transition 3-fold contingency array
P3 <- table(X[1:(N-2)], X[2:(N-1)], X[3:N])
dimnames(P3) <- lapply(list("X(t-2)=", "X(t-1)=" ,"X(t)="),
                       paste, sep = "", levels(as.factor(X)))
## apply ONE indendence test 
fisher.test(P3[ , 1, ], simulate.p.value = TRUE)
## plot conditional distr.
library(lattice)
X3 <- data.frame(X = X[3:N], lag1X =  X[2:(N-1)], lag2X = X[1:(N-2)])
histogram( ~ X | lag1X + lag2X, data = X3, col = "SteelBlue3")

]


2

Creo que plácida y mpiktas han dado enfoques muy reflexivos y excelentes.

P(Xi=x|Xi1=y)P(Xi=x|Xi1=y and Xi2=z)

xyzzyxzyxxyxx

Entonces el estadístico de prueba sería la diferencia entre estas proporciones estimadas. La complicación de la comparación estándar de las secuencias de Bernoulli es que están correlacionadas. Pero podría hacer una prueba de arranque de proporciones binomiales en este caso.

01(0 0,0 0), (0 0,1), (1,0 0) y (1,1)donde el primer componente es el resultado de dos etapas y el segundo es el resultado de tres etapas correspondiente. Luego puede aplicar la prueba de McNemar a la tabla.


I see what you are referring to here although I'm finding the first paragraph very terse however. For example "Compute sample estimates[...], then test for difference in proportions". What do you mean by sample estimates? Surely there would be no variance in
P(Xi|Xi1=y)
or am I misunderstanding your train of thought?
HCAI

@user1134241 You mentioned "empirically observed", I assumed that you have data from this stochastic sequence. If you want to estimate P(Xi=x|Xi1=y) for each index i-1 where Xi1=y, count the number of times Xi = x and divide it by the number of times Xi1 = y (regardless of what Xi equals). That is an estimate because the observed finite sequence is just a sample of a portion of a sequence of the stochastic process.
Michael R. Chernick

In your last paragraph, let me ask what constitute a success and exactly? In the case where you say a two-step transition: are you saying iji and a 3-step would be ijki?
HCAI

1

You could bin the data into evenly spaced intervals, then compute the unbiased sample variances of subsets {Xn+1:Xn=x1,Xnk=x2}. By the law of total variance,

Var[E(Xn+1|Xn,Xnk)|Xn]=Var[Xn+1|Xn]E(Var[Xn+1|Xn])

The LHS, if it is almost zero, provides evidence that the transition probabilities do not depend on Xnk, though it is clearly a weaker statement: e.g., let Xn+1N(Xn,Xn1). Taking the expected value of both sides of the above equation, the RHS can be computed from the sample variances (i.e., replacing expected values with averages). If the expected value of the variance is zero then the variance is 0 almost always.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.