Quiero comenzar con un escenario que me hizo pensar en qué tan bien MCTS puede funcionar: supongamos que hay un movimiento que aún no se ha agregado al árbol de búsqueda. Es algunas capas / movimientos demasiado profundos. Pero si jugamos este movimiento, el juego básicamente se gana. Sin embargo, supongamos también que todos los movimientos que podrían realizarse en el estado de juego dado son muy, muy malos. En aras de la discusión, digamos que hay 1000 movimientos posibles y solo uno de ellos es bueno (pero muy bueno) y el resto es muy malo. MCTS no podría reconocer esto y no¿Creció el árbol de búsqueda hacia este movimiento y también calificó muy mal este subárbol? Sé que MCTS finalmente converge a minimax (y eventualmente construirá todo el árbol si hay suficiente memoria). Entonces debe saber que el movimiento es bueno a pesar de que hay muchas posibilidades malas. Pero supongo que en la práctica esto no es algo en lo que uno pueda confiar. Tal vez alguien pueda decirme si esta es una evaluación correcta de mi parte.
Además de este escenario especial, también me gustaría saber si hay otros escenarios en los que MCTS funcionará mal (o bien extraordinariamente).