Libros sobre aprendizaje por refuerzo

9

He estado tratando de entender el aprendizaje por refuerzo durante bastante tiempo, pero de alguna manera no puedo visualizar cómo escribir un programa para el aprendizaje por refuerzo para resolver un problema mundial de la red. ¿Me puede sugerir algunos libros de texto que me ayuden a construir una concepción clara del aprendizaje por refuerzo?

machine-learning books reinforcement-learning

— niña101
fuente

stats.stackexchange.com/questions/130130/…

— Anton Tarasenko

Consulte openai también es un buen lugar para aprender Aprendizaje de refuerzo de python básicamente

— Vineet Kothari

7

Aquí tienes algunas buenas referencias sobre el aprendizaje por refuerzo:

Clásico

Sutton RS, Barto AG. Aprendizaje de refuerzo: una introducción. Cambridge, Mass: A Bradford Book; 1998. 322 p.

El borrador para la segunda edición está disponible de forma gratuita: http://incompleteideas.net/book/the-book-2nd.html

Russell / Norvig Capítulo 21:

Russell SJ, Norvig P, Davis E. Inteligencia artificial: un enfoque moderno. Upper Saddle River, Nueva Jersey: Prentice Hall; 2010

Más técnico

Szepesvári C. Algoritmos para el aprendizaje por refuerzo. Conferencias de síntesis sobre inteligencia artificial y aprendizaje automático. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Programación dinámica y control óptimo. 4ta edición. Belmont, Mass .: Athena Scientific; 2007. 1270 p. Capítulo 6, vol 2 está disponible de forma gratuita: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Para desarrollos más recientes

Wiering M, van Otterlo M, editores. Aprendizaje reforzado. Berlín, Heidelberg: Springer Berlin Heidelberg; 2012 Disponible en: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Toma de decisiones bajo incertidumbre: teoría y aplicación. 1 edición Cambridge, Massachusetts: The MIT Press; 2015. 352 p.

Aprendizaje de refuerzo multiagente

Buşoniu L, Babuška R, Schutter BD. Aprendizaje de refuerzo de múltiples agentes: una descripción general. En: Srinivasan D, Jain LC, editores. Innovaciones en sistemas y aplicaciones de múltiples agentes - 1. Springer Berlin Heidelberg; 2010 p. 183–221. Disponible en: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Aprendizaje automático de múltiples agentes: un enfoque de refuerzo. Hoboken, Nueva Jersey: Wiley; 2014.

Videos / Cursos

También sugeriría el curso de David Silver en YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

— Juan leni
fuente

7

Hay un curso gratuito en línea sobre el aprendizaje por refuerzo de Udacity. Comprobar: Aprendizaje automático: Aprendizaje por refuerzo

— Sreejithc321
fuente

Vale la pena mencionar que un problema del mundo de la red se presenta como parte de ese curso.

— Neil Slater

sí, he visto eso, pero no lo suficiente como para codificar lo mismo

— girl101

4

Realmente disfruté el refuerzo de aprendizaje: una introducción de Richard Sutton. Proporciona una vista unificadora muy agradable sobre RL, aunque no menciona los enfoques más recientes (es de 1998).

— Martin Modrák
fuente

en realidad quería ver un problema del mundo de la cuadrícula resuelto calculando con lápiz y papel, porque eso me ayudaría a entender el concepto, a menos que pueda entender el concepto que no puedo codificar (especialmente la iteración de valor)

— girl101

1

Puede consultar mi libro: Aprendizaje práctico de refuerzo con Python que explica el aprendizaje de refuerzo desde cero hasta los algoritmos avanzados de aprendizaje de refuerzo avanzado de última generación.

Todo el código junto con la explicación ya está disponible en mi repositorio de github. https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python

— Sudharsan
fuente