Los equilibrios de Nash son indiscutibles en general. Un equilibrio -Nash es un conjunto de estrategias donde, dadas las estrategias de los oponentes, cada jugador obtiene dentro de el máximo beneficio esperado posible. Encontrar un equilibrio -Nash, dado y un juego, es -complete.
Siguiendo estrictamente las definiciones, parece que no hay ninguna razón particular para creer que las estrategias de un equilibrio dado -Nash estén cerca de las estrategias de cualquier equilibrio de Nash. Sin embargo, a menudo vemos que la literatura utiliza de manera un tanto descuidada una frase como "calcular aproximadamente un equilibrio de Nash" cuando significa decir "calcular un equilibrio de Nash aproximado".
Entonces, me pregunto cuándo lo segundo implica lo primero; es decir, ¿para qué juegos podríamos esperar que los equilibrios -Nash estén "cerca" de los equilibrios de Nash?
Más formalmente, supongamos que tengo un juego en jugadores y una secuencia de perfiles de estrategia .
Cada es un equilibrio -Nash, y la secuencia converge a cero.ϵ i ϵ 1 , ϵ 2 , ϵ 3 , ...
Mis preguntas:
¿Cuándo (bajo qué condiciones / supuestos) convergen todas las estrategias? Es decir, para cada jugador , necesariamente convergen.s ( 1 ) j , s ( 2 ) j , s ( 3 ) j , …
¿En qué condiciones adicionales es el límite de esta secuencia realmente un equilibrio de Nash del juego? (Me parece que no se necesitan más suposiciones; es decir , si todas las estrategias convergen, el límite debería ser un NE).
¿Cuándo un algoritmo para calcular el equilibrio -Nash implica necesariamente un algoritmo para calcular aproximadamente las estrategias de un equilibrio de Nash? ¿Son suficientes las condiciones anteriores?
¡Muchas gracias!
Editar 2014-03-19
Después de leer la referencia en la respuesta de Rahul, parece más razonable pensar en términos de distancias entre distribuciones en lugar de secuencias convergentes. Así que intentaré reformular las preguntas y también poner algunas ideas recientes.
(Bueno, esto depende demasiado del algoritmo para tener realmente una respuesta. Sin restricciones en el algoritmo, podría tener dos equilibrios de Nash distintos y luego, al conectar cada vez más pequeño en el algoritmo, la distancia entre sucesivas las salidas aún podrían ser grandes porque las salidas oscilan entre equilibrios).ℓ 1
Supongamos que es un perfil de estrategia, es decir, distribución del producto sobre las estrategias de los jugadores. ¿Para qué juegos podemos decir que es un equilibrio -Nash implica para algún equilibrio de Nash , donde como ? (Tenga en cuenta que lo contrario se mantiene si los pagos están limitados por ).
Esto es realmente complicado porque en la configuración de complejidad lo que llamamos un "juego" es en realidad una secuencia de juegos parametrizados por , el número de estrategias puras ("acciones"). Entonces como , y las tasas relativas importan. Aquí hay un contraejemplo simple para mostrar que la respuesta no es "todos los juegos". Supongamos que arreglamos una secuencia de decrecientes . Luego, para cada , construya el juego de dos jugadores en acciones donde, si un jugador juega la primera acción, obtiene una recompensa de independientemente de lo que juegue el otro jugador; Si un jugador juega la segunda acción, obtiene una recompensa deindependientemente de lo que juegue el otro jugador; y si un jugador juega cualquier otra acción, obtiene una recompensa de independientemente de lo que juegue el otro jugador.
Por lo tanto, cada juego tiene un -equilibrio (ambos juegan la segunda acción) que está al máximo en distancia de su único equilibrio de Nash (ambos juegan la primera acción).
Entonces, dos subpreguntas interesantes:
- Para un juego fijo y fijo , ya sea para "suficientemente pequeño", la condición anterior se cumple (todos los -equilibrios están cerca de los equilibrios de Nash).
- Quizás la misma pregunta esencialmente, pero si la condición se cumple si las diferencias en los pagos están limitadas por una constante como .
La misma pregunta que (2), pero relacionada con los equilibrios reales calculados por algoritmos. Supongo que probablemente obtendremos respuestas algorítmicas / constructivas o ninguna, por lo que la distinción no importa mucho.