Las respuestas ofrecidas me dan algunas ideas sobre lo que está sucediendo aquí. Creo que puede haber habido algunos errores cometidos por accidente. Vea si la siguiente historia tiene sentido: Para comenzar, creo que probablemente haya una fuerte relación entre X e Y en los datos (aquí hay un código y un diagrama):
set.seed(5)
wage <- rlnorm(1000, meanlog=2.3, sdlog=.5)
something_else <- .7*wage + rnorm(1000, mean=0, sd=1)
plot(wage, something_else, pch=3, col="red", main="Plot X vs. Y")
Pero por error Y se predijo solo a partir de la media. Para agravar esto, los residuos del modelo de solo media se trazan contra X, aunque lo que se pretendía era trazar contra los valores ajustados (código y trama):
meanModel <- lm(something_else~1)
windows()
plot(wage, meanModel$residuals, pch=3, col="red",
main="Plot of residuals from Mean only Model against X")
abline(h=0, lty="dotted")
Podemos arreglar esto ajustando el modelo apropiado y trazando los residuos de eso (código y trama):
appropriateModel <- lm(something_else~wage)
windows()
plot(appropriateModel$fitted.values, appropriateModel$residuals, pch=3, col="red",
main="Plot of residuals from the appropriate\nmodel against fitted values")
lines(lowess(appropriateModel$residuals~appropriateModel$fitted.values))
Esto parece solo el tipo de tonterías que hice cuando comencé.