Regresión de series de tiempo con datos superpuestos

Estoy viendo un modelo de regresión que está retrocediendo los rendimientos del índice bursátil año tras año en los retornos rezagados (12 meses) del mismo índice bursátil, diferencia de crédito (diferencia entre la media mensual de bonos sin riesgo y los bonos corporativos rendimientos), tasa de inflación interanual e índice interanual de producción industrial.

Se ve así (aunque sustituiría los datos específicos de India en este caso):

SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +    
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)

SP500YOY es el rendimiento anual para el índice SP500 Para calcular esto, se calcula el promedio mensual de los valores de SP500 y luego se convierte en rendimientos anuales para cada mes (es decir, enero'10-enero'11, febrero'10- Feb'11, Mar'10-Mar'11,..). Por el lado de las variables explicativas, se utiliza un valor rezagado de 12 meses del SP500YOY junto con el CREDITSPREAD en el momento T y la INFLACIÓN y la PRODUCCIÓN INDUSTRIAL dos períodos ADELANTE. El INFLATIONASYMM es un indicador para determinar si la inflación está por encima de un valor umbral de 5.0%. El índice entre paréntesis muestra el índice de tiempo para cada variable.

Esto se estima mediante la regresión lineal estándar de OLS. Para usar este modelo para pronosticar los retornos YOY de 1,2 y 3 meses por delante de SP500, uno tiene que generar pronósticos de inflación de 3,4 y 5 meses y el Índice de Producción Industrial. Estas previsiones se realizan después de ajustar un modelo ARIMA a cada uno de los dos individualmente. Las previsiones de CreditSpread para 1,2 y 3 meses por delante se presentan como estimaciones mentales.

Me gustaría saber si esta regresión lineal de MCO es correcta / incorrecta, eficiente / ineficiente o una práctica estadística generalmente válida.

El primer problema que veo es el de usar datos superpuestos. es decir, los valores diarios del índice bursátil se promedian cada mes y luego se utilizan para calcular los rendimientos anuales que se renuevan mensualmente. Esto debería hacer que el término de error esté autocorrelacionado. Creo que uno tendría que usar alguna 'corrección' en las líneas de uno de los siguientes:

Estimador de covarianza consistente de heteroscedasticidad de White
Estimador de heteroscedasticidad y autocorrelación consistente (HAC) de Newey & West
versión consistente de heteroscedasticidad de Hansen y Hodrick

¿Realmente tiene sentido aplicar la regresión lineal OLS estándar (sin correcciones) a dichos datos superpuestos, y más aún, usar pronósticos ARIMA con 3 períodos de anticipación para variables explicativas para usar en la regresión lineal OLS original para pronosticar SP500YOY? No he visto tal forma antes y, por lo tanto, realmente no puedo juzgarla, sin la excepción de corregir el uso de observaciones superpuestas.

regression time-series autocorrelation

— Vishal Belsare
fuente

Por favor, no publique mensajes cruzados .

— Joshua Ulrich

Aquí hay un par de artículos que tratan sobre este tema:

Britten-Jones y Neuberger, inferencia y estimación mejoradas en regresión con observaciones superpuestas

Harri y Brorsen, el problema de los datos superpuestos

— R_Coholic
fuente

En estos documentos no está muy claro cómo aplicar estas correcciones en la práctica. ¿Hay un tutorial más práctico o un tutorial en alguna parte?

— rinspy

@rinspy Vea quant.stackexchange.com/questions/35216/… para obtener un código sobre Hansen y Hodrick

— Candamir el

¿Puede proporcionar un resumen de la información en estos artículos y cómo proporcionan una resolución a la pregunta?

— gung - Restablece a Monica