Proceso AR (1) con errores de medición heteroscedastic

1. El problema

Tengo algunas mediciones de una variable $y_t$ , donde $t=1,2,..,n$ , para el cual tengo una distribución $f_{y_t}(y_t)$ obtenida a través de MCMC, que por simplicidad supondré que es una gaussiana de media $\mu_t$ y varianza $\sigma_t^2$ .

Tengo un modelo físico para esas observaciones, digamos $g(t)$ , pero los residuos $r_t = \mu_t-g(t)$ parecen estar correlacionados; en particular, tengo razones físicas para pensar que un proceso $AR(1)$ será suficiente para tener en cuenta la correlación, y planeo obtener los coeficientes del ajuste a través de MCMC, para lo cual necesito la probabilidad . Creo que la solución es bastante simple, pero no estoy muy seguro (parece tan simple, que creo que me falta algo).

2. Derivando la probabilidad

Un proceso media cero se puede escribir como: donde asumiré . Los parámetros a estimar son, por lo tanto, (en mi caso, también tengo que agregar los parámetros del modelo $AR(1)$

X_{t} = ϕ X_{t - 1} + ε_{t}, (1)

$X_t = \phi X_{t-1}+\varepsilon_t,\ \ \ (1)$

ε_{t} \sim N (0, σ_{w}^{2})

$\varepsilon_t\sim N(0,\sigma_w^2)$

θ = {ϕ, σ_{w}^{2}}

$\theta = \{\phi,\sigma_w^2\}$

g (t)

$g(t)$ , pero ese no es el problema). Sin embargo, lo que observo es la variable

donde supongo que

, y se conocen los

(los errores de medición) . Como

es un proceso gaussiano,

también lo es. En particular, sé que

R_{t} = X_{t} + η_{t}, (2)

$R_t = X_t+\eta_t,\ \ \ (2)$

η_{t} \sim N (0, σ_{t}^{2})

$\eta_t\sim N(0,\sigma_t^2)$

σ_{t}^{2}

$\sigma_t^2$

X_{t}

$X_t$

R_{t}

$R_t$

por lo tanto,

El próximo desafío es obtener

para

. Para derivar la distribución de esta variable aleatoria, tenga en cuenta que, utilizando la ecuación.

Puedo escribir

X_{1} \sim N (0, σ_{w}^{2} / [1 - ϕ^{2}]),

$X_1 \sim N(0,\sigma_w^2/[1-\phi^2]),$

R_{1} \sim N (0, σ_{w}^{2} / [1 - ϕ^{2}] + σ_{t}^{2}) .

$R_1 \sim N(0,\sigma_w^2/[1-\phi^2]+\sigma_t^2).$

R_{t} | R_{t - 1}

$R_t|R_{t-1}$

t \neq 1

$t\neq 1$

(2)

$(2)$

Usando la ecuación.

, y usando la definición de la ecuación.

, puedo escribir,

Usando la ec.

en esta última expresión, entonces, obtengo,

X_{t - 1} = R_{t - 1} - η_{t - 1} . (3)

$X_{t-1} = R_{t-1}-\eta_{t-1}.\ \ \ (3)$

(2)

$(2)$

(1)

$(1)$

R_{t} = X_{t} + η_{t} = ϕ X_{t - 1} + ε_{t} + η_{t} .

$R_{t} = X_t+\eta_t = \phi X_{t-1}+\varepsilon_{t}+\eta_t.$

(3)

$(3)$

tanto,

y, por lo tanto,

R_{t} = ϕ (R_{t - 1} - η_{t - 1}) + ε_{t} + η_{t},

$R_{t} = \phi (R_{t-1}-\eta_{t-1})+\varepsilon_{t}+\eta_t,$

R_{t} El | R_{t - 1} = ϕ (r_{t - 1} - η_{t - 1}) + ε_{t} + η_{t},

$R_t|R_{t-1} = \phi (r_{t-1}-\eta_{t-1})+\varepsilon_{t}+\eta_t,$

Finalmente, puedo escribir la función de probabilidad como

R_{t} El | R_{t - 1} \sim norte (ϕ r_{t - 1}, σ_{w}^{2} + σ_{t}^{2} - ϕ^{2} σ_{t - 1}^{2}) .

$R_t|R_{t-1} \sim N(\phi r_{t-1},\sigma_w^2+\sigma_t^2-\phi^2\sigma^2_{t-1}).$

donde

son las distribuciones de las variables que acabo de definir, es decir, que definen

L (θ) = F_{R_{1}} (R_{1} = r_{1}) \prod_{t = 2}^{norte} F_{R_{t} El | R_{t - 1}} (R_{t} = r_{t} El | R_{t - 1} = r_{t - 1}),

$L(\theta) = f_{R_1}(R_1=r_1) \prod_{t=2}^{n} f_{R_{t}|R_{t-1}}(R_t=r_t|R_{t-1}=r_{t-1}),$

f (\cdot)

$f(\cdot)$

σ^{' 2} = σ_{w}^{2} / [1 - ϕ^{2}] + σ_{t}^{2},

$\sigma'^2 = \sigma_w^2/[1-\phi^2]+\sigma_t^2,$

y definiendo

f_{R_{1}} (R_{1} = r_{1}) = \frac{1}{\sqrt{2 π σ^{' 2}}} exp (- \frac{r_{1}^{2}}{2 σ^{' 2}}),

$f_{R_1}(R_1=r_1) = \frac{1}{\sqrt{2\pi \sigma'^2}}\text{exp}\left(-\frac{r_1^2}{2\sigma'^2}\right),$

σ^{2} (t) = σ_{w}^{2} + σ_{t}^{2} - ϕ^{2} σ_{t - 1}^{2}

$\sigma^2(t) = \sigma_w^2+\sigma_t^2-\phi^2\sigma^2_{t-1}$

f_{R_{t} | R_{t - 1}} (R_{t} = r_{t} | R_{t - 1} = r_{t - 1}) = \frac{1}{\sqrt{2 π σ^{2} (t)}} exp (- \frac{(r_{t} - ϕ r_{t - 1})^{2}}{2 σ^{2} (t)})

$f_{R_{t}|R_{t-1}}(R_t=r_t|R_{t-1}=r_{t-1})=\frac{1}{\sqrt{2\pi \sigma^2(t)}}\text{exp}\left(-\frac{(r_t-\phi r_{t-1})^2}{2\sigma^2(t)}\right)$

3. Preguntas

¿Está bien mi derivación? No tengo ningún recurso para comparar que no sean simulaciones (que parecen estar de acuerdo), ¡y no soy un estadístico!
$MA(1)$ $ARMA(1,1)$ $ARMA(p,q)$

— Néstor
fuente

No tengo exactamente una solución para ti. Pero, creo que este es un tipo de problema de variables de error. He visto estas cosas en la teoría macroeconómica de Thomas Sergent (libro de 1980). Es posible que desee mirar ese.

— Métricas

Gracias por el aporte, @Metrics. ¡Revisaré el libro!

— Néstor

Respuestas:

Estás en el camino correcto, pero has cometido un error al derivar la distribución de $R_t$ dado $R_{t-1}$ : la media condicional no es $\phi r_{t-1}$ . Sus $\phi \widehat{x}_{t-1}$ , dónde $\widehat{x}_{t-1}$ es tu mejor estimación de $X$ del periodo anterior El valor de $\widehat{x}_{t-1}$ incluye información de observaciones anteriores, así como $r_{t-1}$ . (Para ver esto, considere una situación donde $\sigma_w$ y $\phi$ son insignificantes, por lo que efectivamente está estimando una media fija. Después de muchas observaciones, su incertidumbre sobre $X$ será mucho más pequeño que $\sigma_{\eta}$ .) Esto puede ser confuso al principio, porque observa $R$ y no $X$ . Eso solo significa que se trata de un modelo de espacio de estado .
Sí, hay un marco muy general para usar modelos lineales-gaussianos con observaciones ruidosas, llamado filtro de Kalman . Esto se aplica a cualquier cosa con una estructura ARIMA y muchos más modelos también. Tiempo variable $\sigma_{\eta}$ está bien para el filtro de Kalman, siempre que no sea estocástico. Los modelos con, por ejemplo, volatilidad estocástica , necesitan métodos más generales. Para ver cómo se deriva el filtro de Kalman, pruebe Durbin-Koopman o el capítulo 3 de Harvey . En la notación de Harvey, tu modelo tiene $Z=1$ , $d=c=0$ , $H_t = \sigma_{\eta,t}^2$ , $T=\phi$ , $R=1$ y $Q=\sigma^2_w$ .

— Jamie Hall
fuente

Hola Jamie, gracias por tu aporte. Un par de comentarios: 1. No estoy seguro de eso. Fue, en realidad, mi primer intento como solución, pero tanto mi intuición como mis simulaciones no están de acuerdo con eso. La cosa es que en realidad no observo

X_{t}

$X_t$ , Yo observo

R_{t}

$R_{t}$ ; Además, ¿puedes probar (aritméticamente) que la media condicional de la variable aleatoria

R_{t} | R_{t - 1} = r_{t - 1}

$R_{t}|R_{t-1}=r_{t-1}$ (tenga en cuenta que no es

R_{t} | X_{t - 1} = x_{t - 1}

$R_{t}|X_{t-1}=x_{t-1}$ ) es en realidad

ϕ {\hat{x}}_{t - 1}

$\phi \hat{x}_{t-1}$ ? 2. ¿Puede dar más detalles sobre la aplicación del filtro de Kalman a este problema en particular?

— Néstor

Hola Nestor, he editado la respuesta para responder a tus comentarios. Espero que ayude.

— Jamie Hall el

Hola Jamie: sobre el segundo punto, está bien, gracias :-)! Sin embargo, todavía no puedo ver tu primer punto. ¿Me puede señalar una derivación formal? En particular, me gustaría saber qué parte de mi razonamiento está mal (y por qué).

— Néstor

Se saltó un paso: la distribución de

X_{1}

$X_1$ dado

R_{1}

$R_1$ . Sus

N (\frac{σ_{x, 1}^{2}}{(σ_{x, 1}^{2} + σ_{η, 1}^{2})} r_{1}, σ_{x, 2}^{2})

$N(\frac{\sigma^2_{x,1}}{(\sigma^2_{x,1}+\sigma^2_{\eta,1})} r_1, \sigma^2_{x,2})$ , dónde

σ_{x, 1}^{2}

$\sigma_{x,1}^2$ es la varianza que calculó en el primer paso, y

σ_{x, 2}^{2}

$\sigma_{x,2}^2$ es el doble de la media armónica de

σ_{x, 1}^{2}

$\sigma_{x,1}^2$ y

σ_{η, 1}^{2}

$\sigma_{\eta,1}^2$ . (Esto es como una actualización bayesiana con dos archivos PDF gaussianos). Su ecuación (3) es formalmente correcta, pero está desechando información al usar eso en lugar de

p (X_{t - 1} | R_{1 : t - 1})

$p(X_{t-1} | R_{1:t-1})$ .

— Jamie Hall

-1

Honestamente, debe codificar esto en ERRORES o STAN y no preocuparse por eso desde allí. A menos que sea una pregunta teórica.

— DavidShor
fuente

(-1) A esta respuesta; Esta es claramente una pregunta teórica ;-). Considere mejorar por qué cree que debería codificarlo en BUGs o STAN y qué tiene que ver con la pregunta original.

— Néstor