En el contexto del pronóstico, eliminar los valores atípicos es muy peligroso. Por ejemplo, pronostica las ventas de una tienda de comestibles. Digamos que hubo una explosión de gas en el edificio vecino, lo que provocó que cerraras la tienda durante unos días. Esta fue la única vez que la tienda cerró en 10 años. Por lo tanto, obtiene la serie temporal, detecta el valor atípico, lo elimina y pronostica. Silenciosamente asumiste que nada como esto sucederá en el futuro. En sentido práctico, comprimió su varianza observada y las variaciones de coeficiente se redujeron. Por lo tanto, si muestra las bandas de confianza para su pronóstico, serán más estrechas de lo que hubieran sido si no eliminara el valor atípico.
Por supuesto, puede mantener el valor atípico y proceder como de costumbre, pero este tampoco es un buen enfoque. La razón es que este valor atípico sesgará los coeficientes.
Creo que un mejor enfoque en este caso es permitir una distribución de errores con colas gruesas, tal vez una distribución estable. En este caso, su valor atípico no sesgará demasiado los coeficientes. Estarán cerca de los coeficientes con un valor atípico eliminado. Sin embargo, el valor atípico aparecerá en la distribución del error, la varianza del error. Esencialmente, terminará con bandas de confianza de pronóstico más amplias.
Las bandas de confianza transmiten una información muy importante. Si pronostica que las ventas serían de $ 1,000,000 este mes, pero hay un 5% de posibilidades de que sean $ 10,000, esto afecta sus decisiones sobre gastos, administración de efectivo, etc.