¿Cómo probar si una matriz de covarianza cruzada no es cero?

Los antecedentes de mi estudio :

En un muestreo de Gibbs donde tomamos muestras de (la variable de intereses) e de y respectivamente, donde e son vectores aleatorios dimensionales. Sabemos que el proceso generalmente se divide en dos etapas: $X$ $Y$ $P(X|Y)$ $P(Y|X)$ $X$ $Y$ $k$

Burn-in Period, donde descartamos todas las muestras. Denote las muestras como e . $X_1\sim X_t$ $Y_1\sim Y_t$
Período "posterior a la quema", donde promediamos las muestras como nuestro resultado final deseado. $\bar{X} = \frac{1}{k}\sum_{i=1}^k X_{t+i}$

Sin embargo, las muestras en la secuencia "after-burn-in" no se distribuyen independientemente. Por lo tanto, si quiero inspeccionar la varianza del resultado final, se convierte en $X_{t+1}\sim X_{t+k}$

Var [\bar{X}] = Var [\sum_{i = 1}^{k} X_{t + i}] = \frac{1}{k^{2}} (\sum_{i = 1}^{k} Var [X_{t + i}] + \sum_{i = 1}^{k - 1} \sum_{j = i + 1}^{k} Cov [X_{t + i}, X_{t + j}])

$\operatorname{Var}[\bar{X}] = \operatorname{Var}\left[\sum_{i=1}^k X_{t+i}\right] = \frac{1}{k^2}\left(\sum_{i=1}^k\operatorname{Var}[X_{t+i}] + \sum_{i=1}^{k-1} \sum_{j=i+1}^k \operatorname{Cov}[X_{t+i},X_{t+j}]\right)$

Aquí el término es una matriz de covarianza cruzada aplica a cualquier con . $\operatorname{Cov}[X_{t+i},X_{t+j}]$ $k\times k$ $(i,j)$ $i<j$

Por ejemplo, tengo

X_{t + 1} = (1, 2, 1)^{'} X_{t + 2} = (1, 0, 2)^{'} X_{t + 3} = (1, 0, 0)^{'} X_{t + 4} = (5, 0, - 1)^{'}

$X_{t+1} = (1,2,1)'\\ X_{t+2} = (1,0,2)'\\ X_{t+3} = (1,0,0)'\\ X_{t+4} = (5,0,-1)'$

entonces podría estimar la matriz de covarianza con $\operatorname{Cov}[X_{t+i}, X_{t+i+1}]$

\frac{1}{3} \sum_{i = 1}^{3} (X_{t + i} - μ_{t + i}) (X_{t + i + 1} - μ_{t + i + 1})^{'}

$\frac{1}{3}\sum_{i=1}^3 (X_{t+i}-\mu_{t+i})(X_{t+i+1}-\mu_{t+i+1})'$

Ahora me interesa saber si la estimación resultante es significativamente distinta de cero, de modo que necesito incluirla en mi estimación de varianza de . $\operatorname{Var}[\bar{X}]$

Entonces aquí vienen mis preguntas :

Nos muestra de . Dado que está cambiando, creo que y no son de la misma distribución, entonces no es lo mismo que . ¿Es correcta esta afirmación? $X_{t+i}$ $P(X_{t+i}|Y_{t+i})$ $Y_{t+i}$ $X_{t+i}$ $X_{t+i+1}$ $\operatorname{Cov}[X_{t+i},X_{t+j}]$ $\operatorname{Cov}[X_{t+i},X_{t+i}]$
Supongamos que tengo suficientes datos para estimar (muestras vecinas en la secuencia), ¿hay alguna forma de probar si la matriz de covarianza es significativamente matriz no cero? Hablando en términos generales, estoy interesado en un indicador que me guíe a algunas matrices de covarianza cruzada significativas que deberían incluirse en mi estimación de varianza final. $\operatorname{Cov}[X_{t+i},X_{t+i+1}]$

— TomHall
fuente

En realidad, ahora esto parece una muy buena pregunta; Creo que otras personas estarán en mejores condiciones para dar buenas respuestas que yo, por lo que me gustaría promover esto (otorgarle una recompensa) cuando sea elegible en breve. [Respuestas cortas: 1. Esas dos covarianzas son diferentes. 2. No es necesario probar si las variables consecutivas están correlacionadas (en todos los casos, excepto en los más triviales; el algoritmo funciona generando variables dependientes): es más interesante medir la correlación que probarla;] ... si las buenas respuestas no aparecen. Expandiré esos breves comentarios en una respuesta completa

— Glen_b: reinstala a Monica el

Parece que su pregunta es mucho más amplia que su pregunta de título. Dirigiéndose específicamente a su pregunta de título, existe la prueba de esfericidad de Bartlett que permite evaluar si una matriz de covarianza de muestra es diagonal. Probablemente necesite adaptarlo a su escenario de covarianza cruzada (su "matriz de covarianza" en realidad no es realmente una matriz de covarianza, es una matriz de covarianza cruzada; es un bloque fuera de la diagonal de la matriz de covarianza completa de X_t y X_ { t + 1} juntos). CC a @Glen_b.

— ameba dice Reinstate Monica

Añadiría que las covarianzas tienden a decaer más o menos geométricamente (cada vez más a medida que te alejas); los valores muy separados en el tiempo tienden a tener una correlación muy baja ( no cero pero en gran medida ignorable), mientras que los valores cercanos a veces pueden ser bastante dependientes.

— Glen_b -Reinstala a Mónica el

@ Tom 1. Sin embargo, con series estacionarias, en rezagos muy distantes (¡4 no está distante!), ¿Qué le sucede al ACF? 2. Sabes algo sobre cómo funcionan los valores generados por MCMC que no puedes decir sobre series temporales arbitrarias ... son Markovian . Notarás que mis comentarios anteriores no afirman que los retrasos más cercanos deben mostrar decadencia geométrica (por ejemplo, no dije que fuera imposible ver una correlación más alta en el retraso 4 que 3). Aún obtendrá (si se cumplen ciertas condiciones) tendencia a la decadencia geométrica en el ACF a medida que se aleja.

$\quad$

— Glen_b -Reinstala a Mónica el

Si su período de muestreo es tan corto que no tiene estimaciones muy precisas de la covarianza cruzada, es posible que solo tenga que lidiar con el hecho de que sus estimaciones de los términos de covarianza cruzada tienen un error estándar más grande. Dado mi entendimiento actual, voy a reafirmar aún más mi objeción a probar las correlaciones. Las pruebas de hipótesis para correlaciones cero vs no cero no abordan su problema aquí.

— Glen_b -Reinstale a Mónica el

Nos muestra de . Como está cambiando, creo que y no son de la misma distribución [...] $X_{t+i}$ $P(X_{t+i}|Y_{t+i})$ $Y_{t+i}$ $X_{t+i}$ $X_{t+i+1}$

Aquí está confundiendo distribuciones condicionales e incondicionales, vea también mi próximo comentario. Condicional en e , . Pero el objetivo de la construcción de su muestreador de Gibbs todo es muestra de las distribuciones estacionarias de e . En términos generales, si ha ejecutado su cadena durante el tiempo suficiente y para que siga la distribución estacionaria, puede decir significa que la distribución incondicional de también es invariante. En otras palabras, como $Y_{t+i} = y_1$ $Y_{t+i+1} = y_2$ $P(X_{t+i}|Y_{t+i} = y_1) \neq P(X_{t+i+1}|Y_{t+i+1} = y_2)$ $X$ $Y$ $\{Y_t\}$

\begin{aligned} P (X_{t}) = \int_{Y} P (X_{t} | Y_{t}) d P (Y_{t}), \end{aligned}

$\begin{align} P(X_t) = \int_{\mathcal{Y}}P(X_t|Y_t)dP(Y_t), \end{align}$

X_{t}

$X_t$

t \to \infty

$t \to \infty$ y convergemos a las distribuciones estacionarias, , ya que e se extraerán asintóticamente de (¡la misma!) distribución estacionaria . Por otro lado y como antes, una vez que condicionamos e , esto ya no se mantendrá, independientemente de cuán grande sea .

P (X_{t + i} | Y_{t + i}) = P (X_{t + i + 1} | Y_{t + i + 1})

$P(X_{t+i}|Y_{t+i}) = P(X_{t+i+1}|Y_{t+i+1})$

Y_{t + i}

$Y_{t+i}$

Y_{t + i + 1}

$Y_{t+i+1}$

P (Y_{t})

$P(Y_t)$

Y_{t + i} = y_{1}

$Y_{t+i} = y_1$

Y_{t + i + 1} = y_{2}

$Y_{t+i+1} = y_2$

t

$t$

[...] entonces no es lo mismo que . ¿Es correcta esta afirmación? $\operatorname{Cov}[X_{t+i},X_{t+j}]$ $\operatorname{Cov}[X_{t+i},X_{t+i}]$

Sí, esto es correcto, aunque , es decir, y tienen la misma distribución estacionaria. Sé que esto puede ser confuso, pero tengan paciencia conmigo. Defina con . Mediante la sustitución , se puede mostrar que , y dado que las sumas (infinitas) de normales siguen siendo normales, mantiene que y así . Claramente, e $X_{t+1} \sim X_{t}$ $X_t$ $X_{t+1}$ $Y_t = 0.8\cdot Y_{t-1} + \varepsilon_t$ $\varepsilon_t \overset{iid}{\sim} N(0,1)$ $Y_t = \sum_{i=0}^t0.8^i \varepsilon_{t-i}$ $\text{Var}(Y_t) = \sum_{i=0}^t0.8^{2i} = \dfrac{1}{1-0.8^2}$ $Y_t \overset{iid}{\sim} N(0, \dfrac{1}{1-0.8^2})$ $Y_t$ $Y_{t+1}$ seguirá estando correlacionado, pero también vendrán de la misma distribución ( ). Una situación similar es válida para tu . $Y_{t+1} \sim Y_{t}$ $X_t$

Supongamos que tengo suficientes datos para estimar (muestras vecinas en la secuencia), ¿hay alguna forma de probar si la matriz de covarianza es significativamente matriz no cero? Hablando en términos generales, estoy interesado en un indicador que me guíe a algunas matrices de covarianza cruzada significativas que deberían incluirse en mi estimación de varianza final. $\operatorname{Cov}[X_{t+i},X_{t+i+1}]$

Bueno, si tuvieras infinitas observaciones, todas serán significativas eventualmente. Claramente, no puede hacer esto en la práctica, pero hay formas de 'cortar' la expansión después de algunos términos, vea la excelente respuesta aceptada aquí. Básicamente, usted define un núcleo que decae a y asigna pesos a las primeras matrices de covarianza que podría calcular. Si desea elegir de una manera en principios, tendrá que profundizar un poco en la literatura, pero la publicación que vinculé le brinda algunas buenas referencias para hacer exactamente eso. $k(\cdot)$ $0$ $l_T$ $l_T$

— Jeremias K
fuente