Parece que lo estás usando R
. Si es así, tenga en cuenta que puede identificar puntos en un diagrama de dispersión usando ? Identificar . Creo que hay varias cosas pasando aquí. Primero, tiene un punto muy influyente en la trama de LN_RT_vol_in ~ LN_AT_vol_in
(el resaltado) en aproximadamente (.2, 1.5). Es muy probable que este sea el residuo estandarizado que es aproximadamente -3.7. El efecto de ese punto será aplanar la línea de regresión, inclinándola más horizontalmente que la línea agudamente ascendente que de otro modo habría obtenido. Un efecto de eso es que todos sus residuos se rotarán en sentido contrario a las agujas del reloj en relación con el lugar donde de otro modo se habrían ubicado dentro delresidual ~ predicted
trama (al menos cuando se piensa en términos de esa covariable e ignora la otra).
No obstante, la línea recta aparente de los residuos que ve todavía estaría allí, ya que existen en algún lugar de la nube tridimensional de sus datos originales. Pueden ser difíciles de encontrar en cualquiera de las parcelas marginales. Puede usar la función de identificación () para ayudar, y también puede usar la paquete rgl para crear un diagrama de dispersión 3D dinámico que puede rotar libremente con el mouse. Sin embargo, tenga en cuenta que los residuos de línea recta están todos por debajo de 0 en su valor predicho, y tienen por debajo de 0 residuos (es decir, están por debajo de la línea de regresión ajustada); eso te da una gran pista sobre dónde mirar. Mirando de nuevo a tu parcela deLN_RT_vol_in ~ LN_AT_vol_in
, Creo que puedo verlos. Hay un grupo bastante recto de puntos que se extiende diagonalmente hacia abajo y hacia la izquierda desde aproximadamente (-.01, -1.00) en el borde inferior de la nube de puntos en esa región. Sospecho que esos son los puntos en cuestión.
En otras palabras, los residuos se ven de esa manera porque ya están en algún lugar dentro del espacio de datos. En esencia, esto es lo que sugiere @ttnphns, pero no creo que sea una constante en ninguna de las dimensiones originales: es una constante en una dimensión en ángulo con respecto a los ejes originales. Además, estoy de acuerdo con @MichaelChernick en que esta aparente rectitud en el gráfico residual es probablemente inofensiva, pero que sus datos no son realmente muy normales. Sin embargo, son algo normales, y parece que tiene una cantidad de datos decente, por lo que el CLT puede cubrirlo, pero es posible que desee arrancar por si acaso. Finalmente, me preocuparía que ese "valor atípico" esté impulsando sus resultados; Un enfoque robusto es probablemente merecido.