Actualmente estoy en un proyecto donde básicamente necesito, como todos lo hacemos, comprender cómo se relaciona la salida con la entrada . La particularidad aquí es que los datos son proporcionados de una en una, por lo que quiero actualizar mi análisis cada vez que recibo un nuevo . Creo que esto se llama procesamiento "en línea", en oposición al procesamiento "por lotes", donde tiene todos los datos necesarios y realiza sus cálculos utilizando todos los datos al mismo tiempo.( y , x ) ( y , x )
Así que busqué ideas y finalmente llegué a la conclusión de que el mundo está dividido en tres:
La primera parte es la tierra de las estadísticas y la econometría. La gente allí hace OLS, GLS, variables de instrumentos, ARIMA, pruebas, diferencia de diferencias, PCA y otras cosas. Esta tierra está dominada principalmente por la linealidad y solo realiza el procesamiento "por lotes".
La segunda parte es la isla del aprendizaje automático y otras palabras como inteligencia artificial, aprendizaje supervisado y no supervisado, redes neuronales y SVM. Tanto el procesamiento "por lotes" como el "en línea" se realizan aquí.
La tercera parte es un continente entero que acabo de descubrir, en su mayoría poblado por ingenieros eléctricos, por lo que parece. Allí, las personas a menudo agregan la palabra "filtro" a sus herramientas, e inventaron grandes cosas como el algoritmo de Widrow-Hoff, los mínimos cuadrados recursivos , el filtro de Wiener , el filtro de Kalman y probablemente otras cosas que aún no he descubierto. Aparentemente, realizan principalmente el procesamiento "en línea", ya que se adapta mejor a sus necesidades.
Entonces mi pregunta es, ¿tiene una visión global de todo esto? Tengo la impresión de que estas tres partes del mundo no hablan demasiado entre sí. ¿Me equivoco? ¿Existe una gran teoría unificada de comprensión de cómo relaciona con ? ¿Conoces algún recurso donde se puedan establecer las bases de esa teoría?X
No estoy seguro de si esta pregunta realmente tiene sentido, pero estoy un poco perdido entre todas esas teorías. Me imagino la respuesta a la pregunta "¿debería usar esto o aquello?" sería "depende de lo que quieras hacer (y de tus datos)". Sin embargo, siento que esos tres mundos intentan responder a la misma pregunta ( ?) Y, por lo tanto, debería ser posible tener una visión más alta de todo esto y comprender profundamente lo que hace que cada técnica sea particular.