Estoy tratando de automatizar la detección de valores atípicos en series de tiempo y utilicé una modificación de la solución propuesta por Rob Hyndman aquí .
Digamos que mido las visitas diarias a un sitio web de varios países. Para algunos países donde las visitas diarias son de cientos o miles, mi método parece estar funcionando razonablemente.
Sin embargo, en los casos en que un país solo realiza 1 o 2 visitas por día, los límites del algoritmo son muy estrechos (por ejemplo, 1 ± 0,001) y, por lo tanto, las 2 visitas se consideran atípicas. ¿Cómo podría detectar automáticamente tales casos y cómo podría tratarlos para identificar valores atípicos? No me gustaría establecer un umbral manual de, digamos, 100 visitas por día.
¡Gracias!