¿Cuándo convergen las estrategias de equilibrio -Nash con las estrategias de equilibrio de Nash?


9

Los equilibrios de Nash son indiscutibles en general. Un equilibrio -Nash es un conjunto de estrategias donde, dadas las estrategias de los oponentes, cada jugador obtiene dentro de el máximo beneficio esperado posible. Encontrar un equilibrio -Nash, dado y un juego, es -complete.ϵϵϵϵPPAD

Siguiendo estrictamente las definiciones, parece que no hay ninguna razón particular para creer que las estrategias de un equilibrio dado -Nash estén cerca de las estrategias de cualquier equilibrio de Nash. Sin embargo, a menudo vemos que la literatura utiliza de manera un tanto descuidada una frase como "calcular aproximadamente un equilibrio de Nash" cuando significa decir "calcular un equilibrio de Nash aproximado".ϵ

Entonces, me pregunto cuándo lo segundo implica lo primero; es decir, ¿para qué juegos podríamos esperar que los equilibrios -Nash estén "cerca" de los equilibrios de Nash?ϵ


Más formalmente, supongamos que tengo un juego en jugadores y una secuencia de perfiles de estrategia .n(s1(1),,sn(1)),(s1(2),,sn(2)),(s1(3),,sn(3)),

Cada es un equilibrio -Nash, y la secuencia converge a cero.ϵ i ϵ 1 , ϵ 2 , ϵ 3 , ...(s1(i),,sn(i))ϵiϵ1,ϵ2,ϵ3,

Mis preguntas:

  1. ¿Cuándo (bajo qué condiciones / supuestos) convergen todas las estrategias? Es decir, para cada jugador , necesariamente convergen.s ( 1 ) j , s ( 2 ) j , s ( 3 ) j , jsj(1),sj(2),sj(3),

  2. ¿En qué condiciones adicionales es el límite de esta secuencia realmente un equilibrio de Nash del juego? (Me parece que no se necesitan más suposiciones; es decir , si todas las estrategias convergen, el límite debería ser un NE).

  3. ¿Cuándo un algoritmo para calcular el equilibrio -Nash implica necesariamente un algoritmo para calcular aproximadamente las estrategias de un equilibrio de Nash? ¿Son suficientes las condiciones anteriores?ϵ

¡Muchas gracias!


Editar 2014-03-19

Después de leer la referencia en la respuesta de Rahul, parece más razonable pensar en términos de distancias entre distribuciones en lugar de secuencias convergentes. Así que intentaré reformular las preguntas y también poner algunas ideas recientes.1

  1. (Bueno, esto depende demasiado del algoritmo para tener realmente una respuesta. Sin restricciones en el algoritmo, podría tener dos equilibrios de Nash distintos y luego, al conectar cada vez más pequeño en el algoritmo, la distancia entre sucesivas las salidas aún podrían ser grandes porque las salidas oscilan entre equilibrios).1ϵ1

  2. Supongamos que es un perfil de estrategia, es decir, distribución del producto sobre las estrategias de los jugadores. ¿Para qué juegos podemos decir que es un equilibrio -Nash implica para algún equilibrio de Nash , donde como ? (Tenga en cuenta que lo contrario se mantiene si los pagos están limitados por ).ppϵpq1δqδ0ϵ01

    Esto es realmente complicado porque en la configuración de complejidad lo que llamamos un "juego" es en realidad una secuencia de juegos parametrizados por , el número de estrategias puras ("acciones"). Entonces como , y las tasas relativas importan. Aquí hay un contraejemplo simple para mostrar que la respuesta no es "todos los juegos". Supongamos que arreglamos una secuencia de decrecientes . Luego, para cada , construya el juego de dos jugadores en acciones donde, si un jugador juega la primera acción, obtiene una recompensa de independientemente de lo que juegue el otro jugador; Si un jugador juega la segunda acción, obtiene una recompensa dennϵ0ϵ1,ϵ2,ϵnn11ϵnindependientemente de lo que juegue el otro jugador; y si un jugador juega cualquier otra acción, obtiene una recompensa de independientemente de lo que juegue el otro jugador.0

    Por lo tanto, cada juego tiene un -equilibrio (ambos juegan la segunda acción) que está al máximo en distancia de su único equilibrio de Nash (ambos juegan la primera acción).nϵn1

    Entonces, dos subpreguntas interesantes:

    1. Para un juego fijo y fijo , ya sea para "suficientemente pequeño", la condición anterior se cumple (todos los -equilibrios están cerca de los equilibrios de Nash).nϵϵ
    2. Quizás la misma pregunta esencialmente, pero si la condición se cumple si las diferencias en los pagos están limitadas por una constante como .n
  3. La misma pregunta que (2), pero relacionada con los equilibrios reales calculados por algoritmos. Supongo que probablemente obtendremos respuestas algorítmicas / constructivas o ninguna, por lo que la distinción no importa mucho.


Siempre hay un punto límite a la que una sub-secuencia de los epsilon-equilibrios convergen, y este límite sería un equilibrio exacto Nash. Esto está implícito en la compacidad del espacio de los perfiles de estrategias mixtas y la continuidad de las funciones de utilidad en función de las probabilidades de estrategias mixtas. (s1...sn)
Noam

Respuestas:


5

El siguiente artículo al menos formaliza la noción de equilibrios aproximados cercanos a los equilibrios exactos, y demuestra algunos resultados estructurales relacionados.

Pranjal Awasthi, Maria-Florina Balcan, Avrim Blum, Or Sheffet y Santosh Vempala (2010). En los equilibrios de Nash de los juegos de aproximación estable. En Actas de la Tercera conferencia internacional sobre teoría de juegos algorítmicos (SAGT'10), 78-89.

En particular, el documento da un ejemplo de una clase de juegos para la pregunta 3.


¡Gracias! Supongo que este es el estado del arte. Agregaré algunos pensamientos en mi pregunta también.
usul
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.