Considere la siguiente figura de los Modelos lineales de Faraway con R (2005, p. 59).
La primera gráfica parece indicar que los residuos y los valores ajustados no están correlacionados, ya que deberían estar en un modelo lineal homoscedástico con errores distribuidos normalmente. Por lo tanto, los gráficos segundo y tercero, que parecen indicar dependencia entre los residuos y los valores ajustados, sugieren un modelo diferente.
Pero, ¿por qué la segunda gráfica sugiere, como lo señala Faraway, un modelo lineal heterocedástico, mientras que la tercera gráfica sugiere un modelo no lineal?
La segunda gráfica parece indicar que el valor absoluto de los residuos está fuertemente correlacionado positivamente con los valores ajustados, mientras que tal tendencia no es evidente en la tercera gráfica. Entonces, si fuera el caso que, teóricamente hablando, en un modelo lineal heteroscedástico con errores distribuidos normalmente
(donde la expresión de la izquierda es la matriz de varianza-covarianza entre los residuos y los valores ajustados) esto explicaría por qué la segunda y tercera parcelas concuerdan con las interpretaciones de Faraway.
¿Pero es éste el caso? Si no es así, ¿de qué otra forma se pueden justificar las interpretaciones de Faraway de la segunda y tercera trama? Además, ¿por qué la tercera gráfica necesariamente indica no linealidad? ¿No es posible que sea lineal, pero que los errores no se distribuyan normalmente o que se distribuyan normalmente, pero no se centren en cero?