¿Cuál es el problema con el uso de R cuadrado en modelos de series de tiempo?

He leído que usar R-cuadrado para series de tiempo no es apropiado porque en un contexto de serie de tiempo (sé que hay otros contextos) R-cuadrado ya no es único. ¿Por qué es esto? Traté de buscar esto, pero no encontré nada. Por lo general, no pongo mucho valor en R-cuadrado (o R-Squared ajustado) cuando evalúo mis modelos, pero muchos de mis colegas (es decir, Business Majors) están absolutamente enamorados de R-Squared y quiero poder explíqueles por qué R-Squared no es apropiado en el contexto de series de tiempo.

regression time-series r-squared

— mmmmmmmmmm
fuente

Búsqueda de Google: "regresión espuria en econometría". O echa un vistazo al periódico de Granger y Newbold . Otros pueden proporcionar más detalles en las respuestas.

— Graeme Walsh

@Richard Hardy, ¿podría dar más detalles sobre "Si tomamos la muestra R2 como una medida de su contraparte poblacional, se desglosa en series de tiempo integradas".

— Siddharth Krishnamurthy

Algunos aspectos del problema:

Si alguien nos da un vector de números una matriz conformable de números , no necesitamos saber cuál es la relación entre ellos para ejecutar un cálculo de álgebra, tratando a como la variable dependiente. El resultado será el álgebra, independientemente de si estos números representan series transversales o series de tiempo o datos de panel, o si la matriz contiene valores rezagados de etc. $\mathbf y$ $\mathbf X$ $y$ $\mathbf X$ $y$

La definición fundamental del coeficiente de determinación es $R^2$

R^{2} = 1 - \frac{S S_{r e s}}{S S_{t o t}}

$R^2 = 1 - \frac {SS_{res}}{SS_{tot}}$

donde es la suma de los residuos al cuadrado de algún procedimiento de estimación, y es la suma de las desviaciones al cuadrado de la variable dependiente de su media muestral. $SS_{res}$ $SS_{tot}$

Combinando, el siempre se calculará de manera única, para una muestra de datos específica, una formulación específica de la relación entre las variables y un procedimiento de estimación específico, sujeto solo a la condición de que el procedimiento de estimación sea tal que proporcione estimaciones puntuales de las cantidades desconocidas involucradas (y, por lo tanto, estimaciones puntuales de la variable dependiente y, por lo tanto, estimaciones puntuales de los residuos). Si alguno de estos tres aspectos cambia, el valor aritmético de cambiará en general, pero esto es válido para cualquier tipo de datos, no solo series de tiempo. $R^2$ $R^2$

Por lo tanto, el problema con y las series temporales no es si es "único" o no (dado que la mayoría de los procedimientos de estimación para datos de series temporales proporcionan estimaciones puntuales). El problema es si el marco de especificación de series temporales "habitual" es técnicamente amigable para el , y si proporciona alguna información útil. $R^2$ $R^2$ $R^2$

La interpretación de como "proporción de la varianza de la variable dependiente explicada" depende de manera crítica de los residuos que suman cero. En el contexto de la regresión lineal (en cualquier tipo de datos) y de la estimación de mínimos cuadrados ordinarios, esto está garantizado solo si la especificación incluye un término constante en la matriz del regresor (una "deriva" en la terminología de series de tiempo). En los modelos de series temporales autorregresivas, en muchos casos no se incluye una deriva. $R^2$

En términos más generales, cuando nos enfrentamos a datos de series temporales, "automáticamente" comenzamos a pensar en cómo evolucionarán las series temporales en el futuro. Por lo tanto, tendemos a evaluar un modelo de series de tiempo basado más en cuán bien predice los valores futuros que en qué tan bien se ajusta a los valores pasados . Pero el refleja principalmente lo último, no lo primero. El hecho bien conocido de que no disminuye en el número de regresores significa que podemos obtener un ajuste perfecto si seguimos agregando regresores ( cualquier regresor, es decir, cualquier serie de números, tal vez totalmente sin relación conceptual con la variable dependiente) . La experiencia demuestra que un ajuste perfecto obtenido de esta manera, también dará abismal $R^2$ $R^2$ predicciones fuera de la muestra.

Intuitivamente, esta compensación tal vez contra-intuitiva ocurre porque al capturar toda la variabilidad de la variable dependiente en una ecuación estimada, convertimos la variabilidad no sistemática en una sistemática, en lo que respecta a la predicción (aquí, "no sistemático" debe entenderse en relación con nuestro conocimiento -desde un punto de vista filosófico puramente determinista, no existe tal cosa como "variabilidad no sistemática". Pero en la medida en que nuestro conocimiento limitado nos obliga a tratar alguna variabilidad como "no sistemática", entonces el intento de convertirla en una sistemática componente, trae predicción desastre).

De hecho, esta es quizás la forma más convincente de mostrarle a alguien por qué no debería ser la principal herramienta de diagnóstico / evaluación cuando se trata de series de tiempo: aumente el número de regresores hasta un punto donde . Luego tome la ecuación estimada e intente predecir los valores futuros de la variable dependiente. $R^2$ $R^2\approx 1$

— Alecos Papadopoulos
fuente

Buena explicación, pero entonces ¿por qué esta esto se añade como una salida estándar de software en el paquete estadístico

@brijesh Regresión-tradición, diría.

— Alecos Papadopoulos

¡Gran respuesta! Sin embargo, contiene poca información que es particular de las series de tiempo. La predicción frente al ajuste en la muestra se aplica a otros tipos de datos, probablemente tanto como a las series de tiempo. Por otro lado, falta un aspecto clave que es particular de las series de tiempo. Me refiero a la regresión de variables integradas. Si tomamos la muestra como una medida de su contraparte poblacional, se desglosa en series de tiempo integradas. (Podría escribir esto como respuesta, pero no tengo tiempo en este momento.)

R^{2}

$R^2$

— Richard Hardy