Métodos de última generación para encontrar cero porciones medias de una serie de tiempo

9

Tengo series temporales ruidosas que necesito segmentar en esas porciones con una media cero y aquellas porciones sin una media cero. Encontrar los límites con la mayor precisión posible es importante (claramente donde el límite se encuentra con precisión es un poco subjetivo). Creo que una variante cusum podría adaptarse para hacer esto, pero como cusum se trata principalmente de encontrar cambios únicos que dejen completamente sin abordar toda la estrategia de segmentación.

Estoy seguro de que se han realizado muchas investigaciones sobre este problema, pero no he podido encontrarlo.

PD La cantidad de datos en estas series de tiempo es bastante grande, es decir, hasta cientos de millones de muestras, y una muestra individual puede ser un vector con un par de cientos de componentes, por lo que un método que puede calcularse razonablemente rápido es un factor significativo .

PPS No hay una etiqueta de segmentación, de ahí la etiqueta de clasificación.

— John Robertson
fuente

1

Parece que el problema principal aquí es la detección eficiente del punto de cambio, ya que después de eso, la media del segmento se puede encontrar trivialmente con una precisión cada vez mayor en el número de muestras. Un enfoque reciente que podría ser interesante es Z. Harchaoui, F. Bach y E. Moulines. Análisis de puntos de cambio de kernel, Avances en sistemas de procesamiento de información neural (NIPS), 2008.

— tdc
fuente

1

Puede que esto no sea lo último en tecnología, pero un método intuitivo sería suavizar los datos colocando pesos en las observaciones cerca de cada punto en el tiempo. Entonces, si desea saber si la muestra R tiene una media cero en el momento T:

mu(R,T)=w1*Sample(R,T)+w2*Sample(R,T-1)+w3*Sample(R,T+1)....

Quizás los pesos exponenciales pueden ser una buena opción, dependiendo de la definición de dónde se encuentra el límite.

Después de ocuparse de algunos detalles técnicos como la definición al inicio y al final de cada somple, ahora puede simplemente probar si cada mu está lo suficientemente cerca de cero para encontrar los puntos donde la media es cero.

— Dennis Jaheruddin
fuente