Este es un concepto muy importante cuando el KOTH involucra un conjunto relativamente simple de decisiones, involucra solo a unos pocos jugadores (típicamente 2) y es determinista. Un equilibrio de Nash describe una posición de "estancamiento": si los dos jugadores han decidido sus dos estrategias, entonces los dos jugadores están efectivamente encerrados en esas posiciones: cualquier jugador que cambie su estrategia simplemente crea vulnerabilidades adicionales.
Ejemplos de juegos donde los equilibrios de Nash son importantes son:
- Piedra-Papel-Tijera (-Lizard-Spock), en el que una estrategia "inmejorable" es un juego aleatorio
- Morra , que tiene un "espectro" de equilibrios. Peter Taylor escribió un buen ejemplo en su respuesta aquí .
- Prisoner's Dilemma, un juego cooperativo notable por tener un estancamiento de "todos pierden"
¿Cómo encontrar un equilibrio?
Encontrar un equilibrio en realidad es bastante simple para la mayoría de los juegos simples, y a menudo es bastante intuitivo. Se pueden encontrar muchos detalles sobre los diversos métodos en Internet. El concepto básico, que normalmente es aplicable, es crear una lista de posibles estrategias que los dos jugadores puedan usar (las opciones proporcionadas por el juego). Si una estrategia está "dominada" por otra, entonces esa estrategia puede eliminarse de la lista y el proceso se repite. Por "dominación" quiero decir que si la estrategia A siempre da un resultado igual o mejor que la estrategia B, contra todas las estrategias restantes del oponente, entonces la estrategia B puede eliminarse de la lista.
Ejemplo: piedra, papel, tijera
RPS tiene algo llamado equilibrio "mixto", lo que significa que hay una distribución involucrada. En lugar de jugar el mismo movimiento repetidamente (lo que conducirá a una derrota rápida), el equilibrio es jugar 1/3 de piedra, 1/3 de papel y 1/3 de tijera en una distribución aleatoria. Si juego al azar, no hay nada que mi oponente pueda hacer para obtener una ventaja sobre mí, punto. Si mi oponente elige no jugar al azar, eso solo crea una vulnerabilidad de su parte.
Los juegos con equilibrio mixto son probablemente los más comunes en PPCG, ya que pueden tomar muchas formas (el único juego interesante que se me ocurre con un equilibrio puro es el dilema del prisionero). Debo señalar que el equilibrio mixto no tiene que ser uniformemente aleatorio , simplemente algo más que jugar el mismo movimiento cada vez.
Usando esta información
El equilibrio de Nash de un juego a menudo representa la "línea de base" desde la cual debes intentar operar. En RPS, jugar aleatoriamente garantiza un punto final alrededor del medio del paquete. Para pasar a la cima, debes comenzar a identificar las debilidades de otros jugadores.
Para hacer esto, debes mantenerte en el equilibrio cuando no estés seguro de las debilidades del oponente. Una vez que esas debilidades han sido identificadas (has detectado que tu oponente no está en equilibrio), entonces necesitas salir suavemente del equilibrio para aprovechar a tu oponente. Esta acción, a su vez, crea debilidades por tu parte. Luego debes detectar cuándo tu oponente está cambiando su estrategia, para que luego puedas detener el ataque y reanudar el juego aleatorio.
Detección de variación del equilibrio
Esto es bastante difícil, y no soy un experto. Las variaciones pueden venir en muchas formas:
- Favorecer algunas opciones por encima / por debajo de otras sin ninguna razón, como un jugador RPS que juega rock dos veces más que las tijeras, o uno que evita jugar papel. Algunas estadísticas relativamente simples pueden detectar esto.
- Basando un movimiento actual de movimientos pasados, en un patrón predecible. Esto incluye copy-cats, bots "late lo que supera tu último movimiento" o bots "ciclismo". Esto requiere una lógica adicional para detectar, ya que la distribución general del movimiento se puede distribuir uniformemente, aunque los movimientos no sean aleatorios. Debes intentar tomar el registro de movimientos y encontrar correlaciones como "el movimiento que hice hace 2 turnos y el movimiento que hizo mi oponente ahora" y "el movimiento que hizo hace 1 turno y el movimiento que hizo ahora", etc.
- Bots cuya distribución de movimientos se basa en la tuya. La vulnerabilidad en estos bots a menudo no se crea (en una cantidad medible) hasta después de que usted haya variado de una distribución aleatoria. En general, su propio bot cae en esta categoría.