Tengo un conjunto de datos compuesto por series de tiempo (8 puntos) con aproximadamente 40 dimensiones (por lo que cada serie de tiempo es de 8 por 40). La salida correspondiente (los posibles resultados para las categorías) es 0 o 1.
¿Cuál sería el mejor enfoque para diseñar un clasificador para series de tiempo con múltiples dimensiones?
Mi estrategia inicial fue extraer características de esas series de tiempo: media, estándar, variación máxima para cada dimensión. Obtuve un conjunto de datos que utilicé para entrenar un RandomTreeForest. Conociendo la ingenuidad total de esto, y después de obtener malos resultados, ahora estoy buscando un modelo más mejorado.
Mis leads son los siguientes: clasificar las series para cada dimensión (usando el algoritmo KNN y DWT), reducir la dimensionalidad con PCA y usar un clasificador final a lo largo de las categorías multidimensionales. Siendo relativamente nuevo en ML, no sé si estoy totalmente equivocado.