Pregunta sobre la función de autocovarianza de muestra

Estoy leyendo un libro de análisis de series temporales y la fórmula para la autocovarianza de muestra se define en el libro como:

\hat{γ} (h) = n^{- 1} \sum_{t = 1}^{n - h} (x_{t + h} - \bar{x}) (x_{t} - \bar{x})

$\widehat{\gamma}(h) = n^{-1}\displaystyle\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x})$

conpara . es la media. $\widehat{\gamma}(-h) = \widehat{\gamma}(h)\;$ $\;h = 0,1, ..., n-1$ $\bar{x}$

¿Alguien puede explicar intuitivamente por qué dividimos la suma por y no por ? El libro explica que esto se debe a que la fórmula anterior es una función definida no negativa y, por lo tanto, se prefiere dividir por , pero esto no me resulta claro. ¿Alguien puede probar esto o mostrar un ejemplo o algo? $n$ $n-h$ $n$

Para mí, lo intuitivo al principio sería dividir por . ¿Es este un estimador de autocovarianza imparcial o sesgado? $n-h$

time-series probability mathematical-statistics

— jjepsuomi
fuente

Si su serie temporal es exactamente con todos los demás , o siendo desconocidos, entonces la suma necesariamente debe detenerse en cuando ocurre en la suma: el siguiente término (para ) que se incluiría en la suma tendría , y no es parte de la muestra.

x_{1}, x_{2}, \dots, x_{n}

$x_1, x_2, \ldots, x_n$

x_{i}

$x_i$

i < 1

$i < 1$

i > n

$i >n$

t = n - h

$t=n-h$

x_{t + h} = x_{n}

$x_{t+h}=x_n$

t = n - h + 1

$t=n-h+1$

x_{n - h + 1 + h} = x_{n + 1}

$x_{n-h+1+h}=x_{n+1}$

x_{n + 1}

$x_{n+1}$

— Dilip Sarwate

@Dilip No creo que ese sea el problema: la pregunta se refiere a si dividir entre o en la definición de .

n

$n$

n - h

$n-h$

\hat{γ}

$\hat{\gamma}$

— whuber

$\widehat{\gamma}$ se usa para crear matrices de covarianza: dados "tiempos" , estima que la covarianza del vector aleatorio (obtenido del campo aleatorio en esos momentos) es la matriz . Para muchos problemas, como la predicción, es crucial que todas esas matrices sean no singulares. Como matrices de covarianza putativas, obviamente no pueden tener valores propios negativos, por lo que deben ser todos positivos-definidos. $t_1, t_2, \ldots, t_k$ $X_{t_1}, X_{t_2}, \ldots, X_{t_k}$ $\left(\widehat{\gamma}(t_i - t_j), 1 \le i, j \le k\right)$

La situación más simple en la que la distinción entre las dos fórmulas

\hat{γ} (h) = n^{- 1} \sum_{t = 1}^{n - h} (x_{t + h} - \bar{x}) (x_{t} - \bar{x})

$\widehat{\gamma}(h) = n^{-1}\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x})$

{\hat{γ}}_{0} (h) = (n - h)^{- 1} \sum_{t = 1}^{n - h} (x_{t + h} - \bar{x}) (x_{t} - \bar{x})

$\widehat{\gamma}_0(h) = (n-h)^{-1}\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x})$

aparece cuando tiene longitud ; digamos, . Para y es sencillo de calcular $x$ $2$ $x = (0,1)$ $t_1=t$ $t_2 = t+1$

{\hat{γ}}_{0} = (\begin{array}{cc} \frac{1}{4} & - \frac{1}{4} \\ - \frac{1}{4} & \frac{1}{4} \end{array}),

$\widehat{\gamma}_0 = \left( \begin{array}{cc} \frac{1}{4} & -\frac{1}{4} \\ -\frac{1}{4} & \frac{1}{4} \end{array} \right),$

que es singular, mientras que

\hat{γ} = (\begin{array}{cc} \frac{1}{4} & - \frac{1}{8} \\ - \frac{1}{8} & \frac{1}{4} \end{array})

$\widehat{\gamma} = \left( \begin{array}{cc} \frac{1}{4} & -\frac{1}{8} \\ -\frac{1}{8} & \frac{1}{4} \end{array} \right)$

que tiene valores propios y , de donde es positivo-definido. $3/8$ $1/8$

Un fenómeno similar ocurre para , donde es positivo-definido pero aplica a los tiempos , digamos, degenera en una matriz de rango (sus entradas alternan entre y ). $x = (0,1,0,1)$ $\widehat{\gamma}$ $\widehat{\gamma}_0$ $t_i = (1,2,3,4)$ $1$ $1/4$ $-1/4$

(Aquí hay un patrón: surgen problemas para cualquier de la forma . $x$ $(a,b,a,b,\ldots,a,b)$

En la mayoría de las aplicaciones, la serie de observaciones es tan larga que para la mayoría de las de interés, que son mucho menores que diferencia entre y tiene ninguna consecuencia. Por lo tanto, en la práctica, la distinción no es gran cosa y, en teoría, la necesidad de una definición positiva anula cualquier deseo posible de estimaciones imparciales. $x_t$ $h$ $n$ $n^{-1}$ $(n-h)^{-1}$

— whuber
fuente

Creo que es importante tener en cuenta que ambos estimadores son estimadores sesgados, incluso si lo divide por nh.

— Corrió el

@Ran Aunque tiene razón en que estos estimadores están sesgados, no estoy de acuerdo con que este sea un tema importante: como se mencionó en el último párrafo, una pequeña cantidad de sesgo es la menor de las preocupaciones de nadie. El estimador imparcial, que usa , apenas difiere de o .

(n - h - 1)^{- 1}

$(n-h-1)^{-1}$

\hat{γ}

$\widehat{\gamma}$

{\hat{γ}}_{0}

$\widehat{\gamma}_0$

— whuber

Muy buena respuesta +1. Quizás sea útil agregar el punto que , mientras que , entonces cuando está cerca de , el estimador puede ser errático, mientras que tendrá fluctuaciones de muestreo uniformemente pequeñas . Ver, por ejemplo, Priestly (1981) "Análisis espectral y series temporales" p324 para una discusión detallada de este punto

V {\hat{γ}}_{0} (h) = O (1 / (n - h))

$\mathbb{V} \hat{\gamma}_0(h) = O(1/(n-h))$

V \hat{γ} (h) = O (1 / n)

$\mathbb{V} \hat{\gamma}(h) = O(1/n)$

h

$h$

n

$n$

{\hat{γ}}_{0} (h)

$\hat{\gamma}_0(h)$

\hat{γ} (h)

$\hat{\gamma}(h)$

\forall h

$\forall h$

— Colin T Bowers