Lo que tienes es una secuencia de eventos según el tiempo, ¡así que no dudes en llamarla Serie temporal!
La agrupación en series de tiempo tiene 2 significados diferentes:
- Segmentación de series de tiempo, es decir, desea segmentar una serie de tiempo individual en diferentes intervalos de tiempo de acuerdo con similitudes internas.
- Agrupación de series de tiempo, es decir, tiene varias series de tiempo y desea encontrar diferentes agrupaciones de acuerdo con las similitudes entre ellas.
Supongo que te refieres al segundo y aquí está mi sugerencia:
Tiene muchos vehículos y muchas observaciones por vehículo, es decir, tiene muchos vehículos. Entonces tiene varias matrices (cada vehículo es una matriz) y cada matriz contiene N filas (Nr de observaciones) y T columnas (puntos de tiempo). Una sugerencia podría ser aplicar PCA a cada matriz para reducir la dimensionalidad y observar los datos en el espacio de la PC y ver si hay relaciones significativas entre las diferentes observaciones dentro de una matriz (vehículo) . Luego, puede poner cada observación para todos los vehículos entre sí y hacer una matriz y aplicar PCA para ver las relaciones de una sola observación entre diferentes vehículos.
Si no tiene valores negativos, la factorización matricial se recomienda encarecidamente para la reducción de dimensiones de los datos del formulario matricial.
Otra sugerencia podría ser poner todas las matrices una encima de la otra y construir un tensor N x M x T donde N es el número de vehículos, M es el número de observaciones y T es la secuencia de tiempo y aplicar la descomposición del tensor para ver las relaciones a nivel mundial.
En este documento se muestra un enfoque muy agradable para la agrupación de series temporales en el que la implementación es silenciosa y directa.
¡Espero que haya ayudado!
Buena suerte :)
EDITAR
Como mencionaste, te refieres a la segmentación de series de tiempo. Agrego esto a la respuesta.
La segmentación de series de tiempo es el único problema de agrupamiento que tiene una verdad fundamental para la evaluación. De hecho, considera la distribución generadora detrás de la serie temporal y la analiza. Recomiendo encarecidamente esto , esto , esto , esto , esto y esto donde su problema se estudie exhaustivamente. Especialmente el último y la tesis doctoral.
¡Buena suerte!