Necesito implementar la detección de anomalías en varios conjuntos de datos de series temporales. Nunca he hecho esto antes y esperaba algún consejo. Me siento muy cómodo con Python, por lo que preferiría que se implementara la solución (la mayor parte de mi código es Python para otras partes de mi trabajo).
Descripción de los datos: son datos de series temporales mensuales que apenas comienzan a recopilarse en los últimos 2 años más o menos (es decir, solo 24-36 períodos de tiempo). Esencialmente, hay varias métricas que se monitorean mensualmente para varios clientes.
time_period client metric score
01-2013 client1 metric1 100
02-2013 client1 metric1 119
01-2013 client2 metric1 50
02-2013 client2 metric2 500
...
Esto es lo que estoy pensando: extraer datos en un marco de datos (pandas), luego calcular un promedio móvil de 6 meses para cada par de cliente / métrica. Si el valor del período de tiempo actual supera algún umbral basado en el promedio de 6 meses, levante la bandera. El problema parece bastante simple. Solo quiero asegurarme de que estoy adoptando un enfoque sólido.
Cualquier consejo para desarrollar esta idea un poco sería muy apreciado. Sé que la pregunta es un poco abstracta, y me disculpo por eso.