El método de Monte Carlo es un enfoque en el que genera una gran cantidad de valores aleatorios o simulaciones y forma algún tipo de conlusiones basadas en los patrones generales, como las medias y las variaciones.
Como ejemplo, podría usarlo para pronósticos meteorológicos . Predecir el clima a largo plazo es bastante difícil, porque es un sistema caótico donde pequeños cambios pueden conducir a resultados muy diferentes. Con los métodos de Monte Carlo, puede ejecutar una gran cantidad de simulaciones, cada una con cambios atmosféricos ligeramente diferentes. Luego puede analizar los resultados y, por ejemplo, calcular la probabilidad de lluvia en un día determinado en función de cuántas simulaciones terminaron con lluvia.
En cuanto al uso de Monte Carlo en Alpha Go, parecen estar usando el llamado Monte Carlo Tree Search . En este enfoque, haces un árbol de movimientos posibles, algunas vueltas hacia el futuro e intentas encontrar la mejor secuencia. Sin embargo, dado que la cantidad de movimientos posibles en el juego de go es muy grande, no podrás explorar mucho más adelante. Esto significa que algunos de los movimientos que se ven bien ahora podrían resultar ser malos más adelante.
Entonces, en Monte Carlo Tree Search, eliges una secuencia prometedora de movimientos y ejecutas una o más simulaciones de cómo podría proceder el juego desde ese punto. Luego puede usar los resultados de esa simulación para tener una mejor idea de cuán buena es realmente esa secuencia específica de movimientos y actualizar el árbol en consecuencia. Repita según sea necesario hasta que encuentre un buen movimiento.
Si desea obtener más información o mirar algunas ilustraciones, encontré un artículo interesante sobre el tema: C. Browne et al., A Survey of Monte Carlo Tree Search Methods ( repositorio abierto / enlace permanente (pago )