Contexto: SysID y controles tipo que se metió en ML.
Creo que la respuesta del usuario110686 hace un buen trabajo al explicar algunas diferencias. SysID se trata necesariamente de modelos dinámicos a partir de datos de entrada / salida, mientras que ML cubre una clase más amplia de problemas. Pero la mayor diferencia que veo es hacer con (a) memoria (número de parámetros); (b) uso final del modelo "aprendido". La identificación del sistema es en gran medida un enfoque de procesamiento de señales que considera representaciones de dominio de frecuencia, análisis de frecuencia de tiempo, etc. Algunas personas de ML llaman a esto "ingeniería de características".
(un recuerdo:SysID se hizo prominente mucho antes de ML cuando se formó un campo de investigación. Por lo tanto, las estadísticas y el procesamiento de señales fueron la base principal de los fundamentos teóricos, y el cálculo fue de miedo. Por lo tanto, las personas trabajaron con una clase de modelos muy simple (compensación de sesgo-varianza) con muy pocos parámetros. Estamos hablando de la mayoría de los parámetros 30-40 y en su mayoría modelos lineales, incluso para los casos en que las personas saben claramente que el problema no es lineal. Sin embargo, ahora la computación es muy barata, pero SysID aún no ha salido de su shell. La gente debería comenzar a darse cuenta de que ahora tenemos sensores mucho mejores, podemos estimar fácilmente miles de parámetros con conjuntos de modelos muy ricos. Algunos investigadores han intentado utilizar redes neuronales para SysID, pero muchos parecen reacios a aceptarlas como "convencionales", ya que no hay muchas garantías teóricas.
(b) Finalizar el uso del modelo aprendido: ahora esto es una cosa que SysID consiguió muy correcta, pero muchos algoritmos de ML no logran capturar. Es importante reconocer que para las aplicaciones de destino, necesariamente está creando modelos que se pueden usar de manera efectiva para la optimización en línea.Estos modelos se utilizarán para propagar cualquier decisión de control tomada, y cuando se configura como un problema de control óptimo, los modelos se convierten en restricciones. Entonces, cuando se utiliza una estructura de modelo extremadamente complicada, la optimización en línea es mucho más difícil. También tenga en cuenta que estas decisiones en línea se toman en la escala de segundos o menos. Una alternativa propuesta es aprender directamente la función de valor de una manera fuera de la política para un control óptimo. Esto es básicamente aprendizaje de refuerzo, y creo que hay una buena sinergia entre SysID y RL.