Preguntas etiquetadas con online-learning

1
El problema de Warren Buffett
Aquí hay una abstracción de un problema de aprendizaje / bandido en línea en el que he estado trabajando en el verano. No he visto un problema como este antes, y parece bastante interesante. Si conoce algún trabajo relacionado, agradecería referencias. El problema La configuración es la de los bandidos …

1
¿Cuáles son las mejores compensaciones de tiempo / error posibles para la solución aproximada de programas lineales?
Para concretar, considere el LP para resolver un juego de suma cero de dos jugadores donde cada jugador tiene acciones. Suponga que cada entrada de la matriz de pagos A es como máximo 1 en valor absoluto. Para simplificar, no hagamos suposiciones de escasez.nortenortenUNUNA Supongamos que el tiempo de ejecución …

2
Lamento interno en la optimización convexa en línea
La "optimización convexa en línea" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) generaliza los algoritmos de aprendizaje de "minimización de arrepentimiento" de una configuración lineal a una configuración convexa y ofrece un buen "arrepentimiento externo" . ¿Existe una generalización similar para el arrepentimiento interno? (No estoy totalmente seguro ni siquiera qué significa …


5
¿Cuáles son buenas referencias para entender el aprendizaje en línea?
Específicamente, solicito recursos para aprender sobre los sistemas de aprendizaje automático que pueden actualizar sus respectivas redes de creencias (o equivalentes) durante la operación. Incluso me he encontrado con algunos, aunque no pude marcarlos. Como puede imaginar, es un tema bastante desafiante para buscar en Internet.
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.