R2 compara el ajuste del modelo elegido con el de una línea recta horizontal (la hipótesis nula). Si el modelo elegido se ajusta peor que una línea horizontal, entonces es negativo. Tenga en cuenta que no siempre es el cuadrado de nada, por lo que puede tener un valor negativo sin violar ninguna regla de las matemáticas. es negativo solo cuando el modelo elegido no sigue la tendencia de los datos, por lo que se ajusta peor que una línea horizontal.R2R2R2
Ejemplo: ajustar los datos a un modelo de regresión lineal restringido para que la intersección en igual a .Y1500
El modelo no tiene ningún sentido dado estos datos. Es claramente el modelo equivocado, quizás elegido por accidente.
El ajuste del modelo (una línea recta restringida para pasar por el punto (0,1500)) es peor que el ajuste de una línea horizontal. Por lo tanto, la suma de cuadrados del modelo es mayor que la suma de cuadrados de la línea horizontal . se calcula como . Cuando es mayor que , esa ecuación calcula un valor negativo para .(SSreg)(SStot)R21−SSregSStotSSregSStotR2
Con una regresión lineal sin restricciones, debe ser positivo (o cero) e igual al cuadrado del coeficiente de correlación, . Un negativo solo es posible con regresión lineal cuando la intersección o la pendiente están restringidas de modo que la línea de "mejor ajuste" (dada la restricción) se ajusta peor que una línea horizontal. Con la regresión no lineal, el puede ser negativo siempre que el modelo de mejor ajuste (dada la ecuación elegida y sus restricciones, si las hay) se ajusta peor a los datos que una línea horizontal.R2rR2R2
En pocas palabras: un negativo no es una imposibilidad matemática o el signo de un error informático. Simplemente significa que el modelo elegido (con sus restricciones) se ajusta muy mal a los datos.R2