Acabo de encontrar una razón convincente para que una respuesta sea la correcta.
La regresión (y la mayoría de los modelos estadísticos de cualquier tipo) se refieren a cómo las distribuciones condicionales de una respuesta dependen de variables explicativas. Un elemento importante de la caracterización de esas distribuciones es alguna medida generalmente llamada "asimetría" (a pesar de que se han ofrecido varias y diferentes fórmulas): se refiere a la forma más básica en que la forma de distribución se aparta de la simetría. Aquí hay un ejemplo de datos bivariados (una respuesta y una sola variable explicativa x ) con respuestas condicionales positivamente sesgadas:yX
La curva azul es el ajuste de mínimos cuadrados ordinarios. Traza los valores ajustados.
Cuando se calcula la diferencia entre una respuesta y su valor ajustado y , cambiamos la ubicación de la distribución condicional, pero no de otra manera cambiar su forma. En particular, su asimetría será inalterada.yy^
Este es un gráfico de diagnóstico estándar que muestra cómo las distribuciones condicionales desplazadas varían con los valores predichos. Geométricamente, es casi lo mismo que "hasta" el diagrama de dispersión anterior.
Si por el contrario se calcula la diferencia en el otro esto va a cambiar y luego revertir la forma de la distribución condicional. Su asimetría será la negativa de la distribución condicional original.y^- y,
Esto muestra las mismas cantidades que la figura anterior, pero los residuos se han calculado restando los datos de sus ajustes, lo que, por supuesto, es lo mismo que negar los residuos anteriores.
Aunque ambas figuras anteriores son matemáticamente equivalentes en todos los aspectos, una se convierte en la otra simplemente volteando los puntos a través del horizonte azul, una de ellas tiene una relación visual mucho más directa con la trama original.
En consecuencia, si nuestro objetivo es relacionar las características de distribución de los residuos con las características de los datos originales, y ese es casi siempre el caso, entonces es mejor simplemente cambiar las respuestas en lugar de cambiarlas y revertirlas.
La respuesta correcta es clara: calcular sus residuos como y- y^.