Tengo un par de valores atípicos en mis datos y quería excluirlos para ver si esto cambia los resultados. En su opinión, ¿cuál es el número máximo de valores atípicos a los que uno debería restringirse?
¡Gracias!
Tengo un par de valores atípicos en mis datos y quería excluirlos para ver si esto cambia los resultados. En su opinión, ¿cuál es el número máximo de valores atípicos a los que uno debería restringirse?
¡Gracias!
Respuestas:
No hay máximo ni mínimo. Los valores atípicos deben eliminarse si son datos incorrectos o si hay otras razones importantes para eliminarlos. Si no hay razones sustantivas, sugiero usar métodos que sean robustos para los valores atípicos. No eliminaría los valores atípicos solo porque están un poco lejos de otros puntos.
Enfatizaría algo que se dijo en otra respuesta y comentarios (creo que las respuestas de @Peter Flom son precisas y que EdM está en contacto con las mediciones, entre todos).
Analizar datos es algo que debe hacerse con cuidado. Debe ser muy consciente del significado de valores atípicos en su contacto. Por ejemplo, suponiendo que su procedimiento de medición se realizó "correctamente" (quiero decir, no ha introducido sesgos, su equipo fue calibrado, la persona que leyó el instrumento lo hizo correctamente, etc., etc.), algunos valores atípicos pueden decir algo interesante y a veces muy importante
Aquí hay un ejemplo inventado, por favor sea indulgente (indíquelo en los comentarios) si no es 100% correcto en todos los aspectos. ;)
Digamos que alguien está probando el efecto de aplicar una cierta cantidad de una sustancia a algunos cultivos (poblaciones) de bacterias. Ahora, "en general", el efecto es estabilizar el número de bacterias en la población, pero existen algunos valores atípicos entre las diferentes culturas.
Imagine que todos sus valores atípicos indican situaciones en las que todas las bacterias están muertas. O que todos los valores atípicos representan culturas donde las poblaciones de bacterias han crecido sin control.
Lo que quiero señalar es que la naturaleza de sus valores atípicos percibidos puede ser significativa y las consecuencias de cada uno son diferentes. Es posible que se encuentre en una situación en la que es intolerable que el número de bacterias aumente o disminuya.
Por supuesto, si notó que algunas poblaciones fueron eliminadas por la sustancia, probablemente investigaría sobre el asunto, ya que es una situación fácilmente reconocible. Pero no todos los fenómenos son fácilmente detectables.
Para concluir, la noción de valores atípicos es algo arbitraria, pero sus significados son múltiples y de diferente importancia. Espero que te haga pensar en el asunto ... :)