¿Qué tan poderosa es la máquina que recientemente derrotó al campeón de jugador de póker?
¿Qué tan poderosa es la máquina que recientemente derrotó al campeón de jugador de póker?
Respuestas:
Del documento de Deep Stack :
Esto parece ser para entrenamiento:
Para la red de turnos, se generaron y resolvieron diez millones de situaciones de turno de póker (desde que se repartió la carta de turno) con 6,144 núcleos de CPU del grupo de investigación Calcul Quebec MP2, utilizando más de 175 años centrales de tiempo de cálculo. Para la red de flop, se generaron y resolvieron un millón de situaciones de flop de póker (desde después de que se reparten las cartas de flop). Estas situaciones se resolvieron utilizando el solucionador de profundidad limitada de DeepStack con la red de turnos utilizada para los valores contrafácticos en los estados públicos inmediatamente después de la tarjeta de turnos. Utilizamos un grupo de 20 GPUS y la mitad de un año de cálculo de GPU. Para la red auxiliar, se generaron diez millones de situaciones y se obtuvieron los valores objetivo enumerando los 22.100 posibles flops y promediando los valores contrafácticos de la salida de la red flop.
Y esto para el juego real:
Los cálculos de rediseño y las evaluaciones de redes neuronales se implementan en Torch7 (53) y se ejecutan en una sola tarjeta gráfica NVIDIA GeForce GTX 1080.
A modo de comparación: la versión distribuida de AlphaGo tomó 1.920 CPU y 280 GPU para ejecutarse.