He encontrado dos definiciones en la literatura para el tiempo de autocorrelación de una serie temporal débilmente estacionaria:
donde es la autocorrelación en el retraso.
Una aplicación del tiempo de autocorrelación es encontrar el "tamaño de muestra efectivo": si tiene observaciones de una serie de tiempo y sabe que es el tiempo de autocorrelación τ , puede fingir que tiene
muestras independientes en lugar de correlacionadas con el fin de encontrar la media. La estimación de partir de los datos no es trivial, pero hay algunas formas de hacerlo (ver Thompson 2010 ).
La definición sin valores absolutos, , parece más común en la literatura; pero admite la posibilidad de τ a < 1 . Usando R y el paquete "coda":
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
La función "efectiveSize" en "coda" utiliza una definición del tiempo de autocorrelación equivalente a , arriba. Hay algunos otros paquetes R que calculan el tamaño efectivo de la muestra o el tiempo de autocorrelación, y todos los que he probado dan resultados consistentes con esto: que un proceso AR (1) con un coeficiente AR negativo tienemuestrasmásefectivas que las correlacionadas series de tiempo. Esto parece extraño
Obviamente, esto nunca puede suceder en el definición τ b del tiempo de autocorrelación.
¿Cuál es la definición correcta de tiempo de autocorrelación? ¿Hay algún problema con mi comprensión de los tamaños de muestra efectivos? El muestra arriba parece que debe estar equivocado ... ¿qué está pasando?