Tengo un conjunto de datos de series de tiempo. Cada serie cubre el mismo período, aunque las fechas reales en cada serie de tiempo pueden no "alinearse" exactamente.
Es decir, si las series temporales se leyeran en una matriz 2D, se vería así:
date T1 T2 T3 .... TN
1/1/01 100 59 42 N/A
2/1/01 120 29 N/A 42.5
3/1/01 110 N/A 12 36.82
4/1/01 N/A 59 40 61.82
5/1/01 05 99 42 23.68
...
31/12/01 100 59 42 N/A
etc
Quiero escribir un script R que separe las series temporales {T1, T2, ... TN} en 'familias' donde una familia se define como un conjunto de series que "tienden a moverse en simpatía" entre sí.
Para la parte de "agrupamiento", tendré que seleccionar / definir un tipo de medida de distancia. No estoy muy seguro de cómo hacerlo, ya que estoy tratando con series de tiempo, y un par de series que pueden moverse en simpatía durante un intervalo, pueden no hacerlo en un intervalo posterior.
Estoy seguro de que hay personas mucho más experimentadas / inteligentes que yo aquí, por lo que agradecería cualquier sugerencia, idea sobre qué algoritmo / heurístico usar para la medida de distancia y cómo usarlo para agrupar las series de tiempo.
Supongo que NO existe un método estadístico robusto establecido para hacer esto, por lo que estaría muy interesado en ver cómo las personas abordan / resuelven este problema, pensando como un estadístico.