El comentario de @Jerome Baum es acertado. Para traer la cita de Gelman aquí:
La detección de valores atípicos puede ser algo bueno. El problema es que a los no estadísticos parece que les gusta aferrarse a la palabra "atípico" sin tratar de pensar en absoluto sobre el proceso que crea el atípico, también algunos libros de texto tienen reglas que parecen ser estúpidas para estadísticos como yo, reglas como etiquetar algo como un valor atípico si tiene más de un número de SD de la mediana, o lo que sea. El concepto de un valor atípico es útil, pero creo que requiere contexto; si etiqueta algo como algo atípico, debe intentar tener una idea de por qué piensa eso.
Para agregar un poco más, ¿qué tal si primero definimos valores atípicos ? Intente hacerlo rigurosamente sin referirse a nada visual como "parece que está lejos de otros puntos". En realidad es bastante difícil.
Diría que un valor atípico es un punto que es altamente improbable dado un modelo de cómo se generan los puntos. En la mayoría de las situaciones, las personas en realidad no tienen un modelo de cómo se generan los puntos, o si lo hacen, se simplifica demasiado y se equivoca la mayor parte del tiempo. Entonces, como dice Andrew, la gente hará cosas como suponer que algún tipo de proceso gaussiano está generando puntos y, por lo tanto, si un punto es mayor que un cierto número de SD de la media, es un valor atípico. Matemáticamente conveniente, no tan basado en principios.
Y ni siquiera nos hemos metido en lo que la gente hace con los valores atípicos una vez que son identificados. La mayoría de la gente quiere tirar estos puntos inconvenientes, por ejemplo. ¡En muchos casos, son los valores atípicos los que conducen a avances y descubrimientos, no los no atípicos!
Hay una gran cantidad de ad-hoc en la detección de valores atípicos, como lo practican los no estadísticos, y Andrew se siente incómodo con eso.