Algunos aspectos del problema:
Si alguien nos da un vector de números una matriz conformable de números , no necesitamos saber cuál es la relación entre ellos para ejecutar un cálculo de álgebra, tratando a como la variable dependiente. El resultado será el álgebra, independientemente de si estos números representan series transversales o series de tiempo o datos de panel, o si la matriz contiene valores rezagados de etc. X y X yyXyXy
La definición fundamental del coeficiente de determinación esR2
R2=1−SSresSStot
donde es la suma de los residuos al cuadrado de algún procedimiento de estimación, y es la suma de las desviaciones al cuadrado de la variable dependiente de su media muestral. S S t o tSSresSStot
Combinando, el siempre se calculará de manera única, para una muestra de datos específica, una formulación específica de la relación entre las variables y un procedimiento de estimación específico, sujeto solo a la condición de que el procedimiento de estimación sea tal que proporcione estimaciones puntuales de las cantidades desconocidas involucradas (y, por lo tanto, estimaciones puntuales de la variable dependiente y, por lo tanto, estimaciones puntuales de los residuos). Si alguno de estos tres aspectos cambia, el valor aritmético de cambiará en general, pero esto es válido para cualquier tipo de datos, no solo series de tiempo.R 2R2R2
Por lo tanto, el problema con y las series temporales no es si es "único" o no (dado que la mayoría de los procedimientos de estimación para datos de series temporales proporcionan estimaciones puntuales). El problema es si el marco de especificación de series temporales "habitual" es técnicamente amigable para el , y si proporciona alguna información útil. R 2 R 2R2R2R2
La interpretación de como "proporción de la varianza de la variable dependiente explicada" depende de manera crítica de los residuos que suman cero. En el contexto de la regresión lineal (en cualquier tipo de datos) y de la estimación de mínimos cuadrados ordinarios, esto está garantizado solo si la especificación incluye un término constante en la matriz del regresor (una "deriva" en la terminología de series de tiempo). En los modelos de series temporales autorregresivas, en muchos casos no se incluye una deriva. R2
En términos más generales, cuando nos enfrentamos a datos de series temporales, "automáticamente" comenzamos a pensar en cómo evolucionarán las series temporales en el futuro. Por lo tanto, tendemos a evaluar un modelo de series de tiempo basado más en cuán bien predice los valores futuros que en qué tan bien se ajusta a los valores pasados . Pero el refleja principalmente lo último, no lo primero. El hecho bien conocido de que no disminuye en el número de regresores significa que podemos obtener un ajuste perfecto si seguimos agregando regresores ( cualquier regresor, es decir, cualquier serie de números, tal vez totalmente sin relación conceptual con la variable dependiente) . La experiencia demuestra que un ajuste perfecto obtenido de esta manera, también dará abismalR 2R2R2 predicciones fuera de la muestra.
Intuitivamente, esta compensación tal vez contra-intuitiva ocurre porque al capturar toda la variabilidad de la variable dependiente en una ecuación estimada, convertimos la variabilidad no sistemática en una sistemática, en lo que respecta a la predicción (aquí, "no sistemático" debe entenderse en relación con nuestro conocimiento -desde un punto de vista filosófico puramente determinista, no existe tal cosa como "variabilidad no sistemática". Pero en la medida en que nuestro conocimiento limitado nos obliga a tratar alguna variabilidad como "no sistemática", entonces el intento de convertirla en una sistemática componente, trae predicción desastre).
De hecho, esta es quizás la forma más convincente de mostrarle a alguien por qué no debería ser la principal herramienta de diagnóstico / evaluación cuando se trata de series de tiempo: aumente el número de regresores hasta un punto donde . Luego tome la ecuación estimada e intente predecir los valores futuros de la variable dependiente.R 2 ≈ 1R2R2≈1