Imagine cualquier línea de regresión ajustada a algunos datos.
Ahora imagine un punto de datos adicional, un valor atípico a cierta distancia del cuerpo principal de los datos, pero que se encuentre en algún lugar a lo largo de esa línea de regresión.
Si la línea de regresión se reajustara, los coeficientes no cambiarían. Por el contrario, eliminar el valor atípico adicional tendría cero influencia en los coeficientes.
Por lo tanto, un valor atípico o de influencia tendría cero influencia si fuera perfectamente consistente con el resto de los datos y el modelo que implica el resto.
Para "línea", lea "plano" o "hiperplano" si lo desea, pero el ejemplo más simple de dos variables y un diagrama de dispersión es suficiente aquí.
Sin embargo, como le gustan las definiciones, a menudo parece que tiende a leer demasiado en ellas, esta es mi definición favorita de valores atípicos:
"Los valores atípicos son valores de muestra que causan sorpresa en relación con la mayoría de la muestra" (WN Venables y BD Ripley. 2002. Estadísticas aplicadas modernas con S. New York: Springer, p.119).
Crucialmente, la sorpresa está en la mente del espectador y depende de algún modelo tácito o explícito de los datos. Puede haber otro modelo en el que el valor atípico no sea sorprendente, digamos si los datos son realmente lognormales o gamma en lugar de lo normal.
PD: No creo que los puntos de apalancamiento carezcan necesariamente de observaciones vecinas. Por ejemplo, pueden ocurrir en pares.