Tenga en cuenta que el supuesto de linealidad del que está hablando solo dice que la media condicional de dado X i es una función linealYiXi . No puede usar el valor de para probar esta suposición.R2
Esto se debe a que es simplemente la correlación al cuadrado entre los valores observados y pronosticados, y el valor del coeficiente de correlación no determina de forma exclusiva la relación entre X e Y (lineal o de otro tipo) y son posibles los dos escenarios siguientes: R2XY
Discutiré cada uno a su vez:
(1) alto, pero el supuesto de linealidad sigue siendo erróneo de una manera importante:R2 el truco aquí es manipular el hecho de que la correlación es muy sensible a los valores atípicos . Suponga que tiene predictores que se generan a partir de una distribución de la mezcla que es normal el 99 % del tiempo y una masa puntual en M el otro 1 % y una variable de respuesta que esX1,...,Xn99%M1%
Yi={ZiMif Xi≠Mif Xi=M
Zi∼N(μ,1)Mμμ=0,M=105XiYi
u = runif(1e4)>.99
x = rnorm(1e4)
x[which(u==1)] = 1e5
y = rnorm(1e4)
y[which(x==1e5)] = 1e5
cor(x,y)
[1] 1
YiXiYiXiXi=M
R2XiYi
Yi=β0+β1Xi+εi
YiXiXivar(εi)=σ2β1R2
x = rnorm(200)
y = 1 + 2*x + rnorm(200,sd=5)
cor(x,y)^2
[1] 0.1125698
R2
Re: ¿Qué hacer cuando no se cumple el supuesto de linealidad y la transformación de los IV tampoco ayuda?
Cuando la no linealidad es un problema, puede ser útil observar las gráficas de los residuos frente a cada predictor; si hay algún patrón notable, esto puede indicar la no linealidad en ese predictor. Por ejemplo, si este gráfico revela una relación "en forma de cuenco" entre los residuos y el predictor, esto puede indicar un término cuadrático faltante en ese predictor. Otros patrones pueden indicar una forma funcional diferente. En algunos casos, puede ser que no haya intentado corregir la transformación o que el modelo verdadero no sea lineal en ninguna versión transformada de las variables (aunque puede ser posible encontrar una aproximación razonable).
R2