Aquí está mi vieja pregunta
Me gustaría preguntar si alguien sabe la diferencia (si hay alguna diferencia) entre los modelos Hidden Markov (HMM) y el Filtro de partículas (PF), y como consecuencia el Filtro Kalman, o en qué circunstancias usamos qué algoritmo. Soy estudiante y tengo que hacer un proyecto, pero primero tengo que entender algunas cosas.
Entonces, de acuerdo con la bibliografía, ambos son modelos de espacio de estado , que incluyen estados ocultos (o latentes o no observados). Según Wikipedia (Hidden_Markov_model) "en HMM, el espacio de estado de las variables ocultas es discreto, mientras que las observaciones pueden ser discretas (generalmente generadas a partir de una distribución categórica) o continuas (típicamente a partir de una distribución gaussiana). Los modelos ocultos de Markov también se pueden generalizar para permitir espacios de estado continuos. Ejemplos de tales modelos son aquellos en los que el proceso de Markov sobre variables ocultas es un sistema dinámico lineal, con una relación lineal entre variables relacionadas y donde todas las variables ocultas y observadas siguen una distribución gaussiana. En casos simples, como el sistema dinámico lineal que se acaba de mencionar, la inferencia exacta es manejable (en este caso, utilizando el filtro de Kalman); sin embargo, en general, la inferencia exacta en HMM con variables latentes continuas no es factible, y se deben usar métodos aproximados,"
Pero para mí esto es un poco confuso ... En palabras simples, esto significa lo siguiente (basado también en más investigaciones que he hecho):
- En HMM, el espacio de estado puede ser discreto o continuo . Además, las observaciones en sí pueden ser discretas o continuas . También HMM es un sistema dinámico lineal y gaussiano o no gaussiano.
- En PF, el espacio de estado puede ser discreto o continuo . Además, las observaciones en sí pueden ser discretas o continuas . Pero PF es un sistema dinámico no lineal (¿y no gaussiano?) (¿Es esa su diferencia?).
- El filtro de Kalman (también me parece lo mismo que HMM) se está utilizando cuando tenemos un sistema dinámico lineal y gaussiano .
Además, ¿cómo sé qué algoritmo elegir, porque para mí todo esto parece lo mismo ... También encontré un documento (no en inglés) que dice que PF aunque puede tener datos lineales (por ejemplo, datos sin procesar de un sensor-cinect que reconoce un movimiento), el sistema dinámico puede ser no lineal. Puede suceder esto? ¿Es esto correcto? ¿Cómo?
Para el reconocimiento de gestos, los investigadores pueden usar HMM o PF, pero no explican por qué seleccionan cada algoritmo ... ¿Alguien sabe cómo puedo ayudarme a distinguir estos algoritmos, a comprender sus diferencias y a elegir el mejor algoritmo?
Lo siento si mi pregunta es demasiado grande, o algunas partes son ingenuas, pero no encontré en ningún lugar una respuesta convincente y científica. ¡Muchas gracias de antemano por su tiempo!
Aquí está mi NUEVA pregunta (según la ayuda de @ conjugateprior)
Entonces, con más lecturas, me gustaría actualizar algunas de mis partes de mi comentario anterior y asegurarme de que entendí un poco más lo que está sucediendo.
- De nuevo en palabras simples, el paraguas son las redes dinámicas bayesianas en las que se incluyen los modelos de HMM y espacio de estado (subclases) ( http://mlg.eng.cam.ac.uk/zoubin/papers/ijprai.pdf ).
- Además, la diferencia inicial entre los 2 modelos es que, en HMM, las variables de estado ocultas son discretas , mientras que las observaciones pueden ser discretas o continuas . En PF, las variables de estado ocultas son continuas (vector de estado oculto de valor real), y las observaciones tienen distribuciones gaussianas .
- Además, según @conjugateprior, cada modelo tiene las 3 tareas siguientes: filtrado, suavizado y predicción. En el filtrado, el modelo HMM usa para variables de estado ocultas discretas el método Algoritmo directo, el espacio de estado usa para variables continuas y el sistema dinámico lineal, el Filtro de Kalman, etc.
- Sin embargo, HMM también se puede generalizar para permitir espacios de estado continuos .
- Con estas extensiones de HMM, los 2 modelos parecen ser conceptualmente idénticos (como también se menciona en Hidden Markov Model vs Markov Transition Model vs State-Space Model ...? ).
Creo que estoy usando un poco más precisa la terminología, pero aún así todo está borroso para mí. ¿Alguien puede explicarme cuál es la diferencia entre HMM y el modelo de espacio de estado ?
Porque realmente no puedo encontrar una respuesta que se ajuste a mis necesidades.
¡Gracias una vez más!