Esta es una pregunta bastante genérica: suponga que quiero construir un modelo para predecir la próxima observación basada en la anterior. observaciones (puede ser un parámetro para optimizar experimentalmente). Básicamente, tenemos una ventana deslizante de características de entrada para predecir la próxima observación.
Puedo usar un enfoque de Modelo oculto de Markov, es decir, Baum-Welch para estimar un modelo, luego Viterbi para predecir un estado actual basado en el último observaciones, luego predice el siguiente estado más probable en función del estado actual, y luego predice la siguiente observación utilizando el siguiente estado más probable y los parámetros HMM (o variantes como encontrar la distribución predictiva de la próxima observación).
O puedo usar un enfoque mucho más simple, usando un modelo sin estado (que puede obtener como entrada el anterior observaciones), por ejemplo, SVM, regresión lineal, splines, árboles de regresión, vecinos más cercanos, etc. Tales modelos se basan en minimizar algún error de predicción sobre el conjunto de entrenamiento y, por lo tanto, conceptualmente, son mucho más simples que un modelo basado en estado oculto.
¿Alguien puede compartir su experiencia al tratar con una opción de modelado? ¿Qué hablaría a favor del HMM y qué a favor de un enfoque de regresión? Intuitivamente, uno debe tomar el modelo más simple posible para evitar un ajuste excesivo; esto habla a favor de un enfoque sin estado ... También tenemos que considerar que ambos enfoques obtienen los mismos datos de entrada para la capacitación (creo que esto implica que si no incorporamos conocimiento de dominio adicional en el modelado de un modelo de estado oculto, por ejemplo corregir ciertos estados y probabilidades de transición, no hay razón por la cual un modelo de estado oculto debería funcionar mejor). Al final, por supuesto, se puede jugar con ambos enfoques y ver qué funciona mejor en un conjunto de validación, pero algunas heurísticas basadas en la experiencia práctica también podrían ser útiles ...
Nota: para mí es importante predecir solo ciertos eventos; Prefiero un modelo que predice bien pocos eventos "interesantes / raros" , en lugar de un modelo que predice eventos "promedio / frecuentes", pero los interesantes no son tan buenos. Quizás esto tiene una implicación para la elección del modelado. Gracias.