No. Los residuos son los valores de condicionales a X (menos la media pronosticada de Y en cada punto de X ). Puede cambiar X modo alguno desea ( X + 10 , X - 1 / 5 , X / π ) y los Y los valores que corresponden a la X valores en un punto dado en X no va a cambiar. Por lo tanto, la distribución condicional de Y (es decir, Y | XYXYXXX+ 10X- 1 / 5X/ πYXXYYEl | X) será lo mismo. Es decir, será normal o no, como antes. (Para comprender este tema de manera más completa, puede serle útil leer mi respuesta aquí: ¿Qué sucede si los residuos se distribuyen normalmente, pero Y no? )
Lo que cambia puede hacer (dependiendo de la naturaleza de la transformación de datos que usa) es cambiar la relación funcional entre X e Y . Con un cambio no lineal en X (por ejemplo, para eliminar el sesgo), un modelo que se especificó correctamente antes se especificará incorrectamente. Las transformaciones no lineales de X a menudo se utilizan para linealizar la relación entre X e Y , para hacer que la relación sea más interpretable o para abordar una cuestión teórica diferente. XXYXXXY
Para obtener más información sobre cómo las transformaciones no lineales pueden cambiar el modelo y las preguntas que el modelo responde (con énfasis en la transformación del registro), puede ayudarlo a leer estos excelentes hilos de CV:
XYβ^0 00 0Xβ^1 (m)=100×β^1 (cm)Y se elevará 100 veces más de 1 metro que más de 1 cm).
Y YYλYX
XY
YXR
set.seed(9959) # this makes the example exactly reproducible
x = rnorm(100) # x is drawn from a normal population
y = 7 + 0.6*x + runif(100) # the residuals are drawn from a uniform population
mod = lm(y~x)
summary(mod)
# Call:
# lm(formula = y ~ x)
#
# Residuals:
# Min 1Q Median 3Q Max
# -0.4908 -0.2250 -0.0292 0.2539 0.5303
#
# Coefficients:
# Estimate Std. Error t value Pr(>|t|)
# (Intercept) 7.48327 0.02980 251.1 <2e-16 ***
# x 0.62081 0.02971 20.9 <2e-16 ***
# ---
# Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#
# Residual standard error: 0.2974 on 98 degrees of freedom
# Multiple R-squared: 0.8167, Adjusted R-squared: 0.8148
# F-statistic: 436.7 on 1 and 98 DF, p-value: < 2.2e-16
En las gráficas, vemos que ambos marginales parecen razonablemente normales, y la distribución conjunta parece razonablemente bivariada normal. No obstante, la uniformidad de los residuos se muestra en su parcela qq; ambas colas caen demasiado rápido en relación con una distribución normal (como de hecho deben hacerlo).