Osborne, el equilibrio de Nash y la corrección de las creencias.

12

En Una introducción a la teoría de juegos, el equilibrio de Osborne se describe de la siguiente manera (p. 21-22):

Primero, cada jugador elige su acción de acuerdo con el modelo de elección racional, dadas sus creencias sobre las acciones de los otros jugadores. Segundo, la creencia de cada jugador sobre las acciones de los otros jugadores es correcta.

Me parece que esta definición no es completamente equivalente a la definición habitual del equilibrio de Nash como un perfil de estrategia donde la estrategia de cada jugador es la mejor respuesta a las estrategias de los demás.

La definición habitual no dice nada acerca de las creencias y, por lo tanto, permite la posibilidad de que las creencias sean incorrectas.

Para tomar una posibilidad trivial, considere el dilema del prisionero. Supongamos que cada jugador cree que el otro jugador no va a confesar. Dado que confesar es una estrategia dominante, cada jugador aún confesaría. Entonces, las acciones constituyen un equilibrio de Nash a pesar de que las creencias de los jugadores son completamente opuestas a las acciones de equilibrio reales.

¿Estoy en lo cierto al entender que la definición de Osborne caracteriza algo más que el equilibrio de Nash?

game-theory

— Jyotirmoy Bhattacharya
fuente

No "la definición habitual no dice nada acerca de las creencias y, por lo tanto, permite la posibilidad de que las creencias sean incorrectas". ¿Simplemente depende del hecho de que siempre tiene un supuesto de racionalidad subyacente en estas definiciones?

— Thorst

9

Introducir el lenguaje de las creencias aquí es un poco extraño, dado que las creencias tienen un significado muy específico en otras partes de la teoría de juegos.

De hecho, la descripción de Osborne recuerda a un equilibrio de Bayes Nash. Podríamos introducir la noción de creencias en la forma normal de un juego de información completa de la siguiente manera: supongamos que con probabilidad cada jugador, , es un "estratégica" tipo que jugará de acuerdo con el equilibrio (Nash), y con probabilidad seleccionará alguna estrategia uniformemente al azar (porque, por ejemplo, es indiferente en todas las acciones). Por lo tanto, tenemos un juego bayesiano donde pensar sobre creencias es más natural. $a_i$ $i$ $1-a_i$

El concepto de solución de Bayes Nash dice que la estrategia de debe ser óptima dado el juego esperado inducido por las estrategias de los otros jugadores y las creencias sobre sus tipos implicadas por . Si consideramos el límite como para todo entonces el equilibrio de Bayes Nash de este juego coincidirá con el concepto de solución descrito por Osborne. $i$ $\{a_j\}_{j\neq i}$ $a_i\rightarrow 1$ $i$

Supongo que la razón por la que Osborne lo escribió así es pedagógica, dado que este es un texto introductorio. Cuando introducimos los estudiantes a juegos estáticos, les decimos que el jugador mejor responde a las acciones de los otros jugadores. Los estudiantes naturalmente quieren saber "¿cómo pueden responder a una estrategia elegida simultáneamente sin saber cuál será esa estrategia?" Esta es, en muchos sentidos, una pregunta filosófica. Las respuestas comunes son $i$

Si el juego se juega con frecuencia (dejando de lado los problemas de otros resultados que pueden sostenerse en juegos repetidos) podemos pensar en Nash como un equilibrio en el sentido de que si convergemos allí, podemos desarrollar una norma por la cual las personas continúen jugar ese equilibrio indefinidamente (y esperar que otros hagan lo mismo).
Si el juego es realmente de una sola vez, generalmente invocamos la idea de que los jugadores intentarán predecir lo que otros harán, y nuestra noción de equilibrio incorpora la idea de que estas predicciones deben ser correctas.

Parece que las predicciones en el segundo punto corresponden a las "creencias" invocadas por Osborne. Sin embargo, es importante enfatizar que estas predicciones / "creencias" son meramente una herramienta informal / intuitiva para ayudarnos a conceptualizar lo que está sucediendo en un equilibrio y no son parte de la definición de tal equilibrio. El concepto del equilibrio de Nash en sí mismo es completamente agnóstico en la noción de creencias (como se observa en un comentario, se define solo sobre las acciones), razón por la cual, cuando Osborne continúa definiendo formalmente el equilibrio de Nash, lo hace sin invocar el idea de creencias en absoluto.

— Ubicuo
fuente

4

La introducción de la creencia hace que el concepto de NE sea comparable a otros conceptos de refinamiento como PBE y equilibrio secuencial, pero el significado de NE no cambia.

El micro libro de texto graduado de Mas-Colell, Whinston y Green (MWG) tiene un resultado para esto

Proposición 9.C.1. Un perfil de estrategia es un equilibrio de Nash de un juego de forma extensa si y solo si existe un sistema de creencias tal que $\sigma$ $\Gamma_E$ $\mu$

El perfil de estrategia es secuencialmente racional dado el sistema de creencias en todos los conjuntos de información modo que . $\sigma$ $\mu$ $H$ $\Pr(H|\sigma)>0$

El sistema de creencias se deriva del perfil de estrategia través de la regla de Bayes siempre que sea posible. $\mu$ $\sigma$

Por lo tanto, el ejemplo del Dilema del Prisionero que usted da donde los jugadores tienen creencias opuestas a lo que la estrategia real del oponente falla en la segunda condición, que requiere que las creencias se deriven de la regla de Bayes siempre que sea posible. De hecho, este es el equivalente matemático del segundo requisito de la definición de Osborne: que la creencia de un jugador sobre las acciones de los otros jugadores es correcta.

— Herr K.
fuente

Creo que hay una diferencia entre MWG y Osborne. MWG dice que para un equilibrio de Nash "existe" un sistema de creencias que lo hace sensible. No hablamos de qué creencias tienen los jugadores, si es que tienen alguna. Osborne dice que los jugadores realmente tienen creencias y que son los correctos. Pensé que este último cambia el significado conceptual de NE ya que la definición habitual no menciona creencias en absoluto y el ejemplo del Dilema del Prisionero muestra que las estrategias no determinan únicamente las creencias.

— Jyotirmoy Bhattacharya

@JyotirmoyBhattacharya: No creo que MWG esté "callado sobre qué creencias, si es que las hay, tienen realmente los jugadores". La condición 2 de la proposición realmente requiere que esta creencia se derive del perfil de la estrategia de equilibrio utilizando la regla de Bayes siempre que sea posible. Por lo tanto, en el ejemplo de PD, cuando un jugador elige el defecto con probabilidad 1, la creencia del otro jugador también debe poner la probabilidad 1 en el defecto de acción y responder mejor dada tal creencia (lo que lo lleva a elegir también el defecto).

— Herr K.

@JyotirmoyBhattacharya: Sin embargo, la creencia para NE no tiene por qué ser única. Esto se debe a que si para un equilibrio dado, se toma una ruta en un árbol de juego con probabilidad cero, entonces la regla de Bayes no se aplica, por lo que cualquier creencia en esa ruta se consideraría "correcta" en un NE. Esta es también la razón por la cual se introducen refinamientos como el equilibrio secuencial, para descartar creencias irracionales fuera de los caminos de equilibrio.

— Herr K.

@JyotirmoyBhattacharya: Además, debido a que es un libro de texto de pregrado, Osborne podría haber elegido un idioma que es más intuitivo que matemáticamente riguroso por razones pedagógicas. Para mí, las dos condiciones en la definición de Osborne son contrapartidas exactas en la propuesta de MWG.

— Herr K.

3

El ejemplo de dilema de tu prisionero solo funciona porque es un juego con estrategias dominantes. Osborne está en lo correcto.

Para responder mejor a la estrategia de otro jugador, como en la definición que das, debo conocer su estrategia. En otras palabras, debo tener creencias sobre lo que están haciendo, y esas creencias deben ser correctas. Esto es un fortalecimiento del concepto de racionalización.

$(\sigma,\mu_1)$ $(\sigma,\mu_2)$ $\mu_2$ $\sigma\in \Sigma$ $\sigma_i\in B_i(\sigma_{-i})$ ... "Creo que esto significa que definir las creencias es innecesario, porque las creencias son exactamente una evaluación correcta del perfil de la estrategia. Hacer referencia, uno de mis libros, da la definición habitual con una cita de Nash (1950), y luego pasa a discutir dos supuestos subyacentes: uno son las creencias correctas y el otro es el juego racional dadas esas creencias correctas.

— Pburg
fuente

Pero para refutar algo, un solo ejemplo es suficiente. Si consideramos que Osborne afirma que su definición es equivalente a la de Nash, entonces, ¿cómo lidiar con el contraejemplo del dilema del prisionero? Entiendo que la definición de Osborne es un fortalecimiento de la racionalización, afirmo que no es el equilibrio de Nash por la simple razón de que aquí el equilibrio se define sobre acciones y creencias, mientras que el equilibrio de Nash no dice nada sobre las creencias.

— Jyotirmoy Bhattacharya

1

Es una definición, no una prueba.

— Pburg

Lo suficientemente justo. Pero es una definición de un concepto que ya tiene otra definición bien aceptada. Así que espero que si el autor no menciona lo contrario, está afirmando que las dos definiciones son equivalentes.

— Jyotirmoy Bhattacharya

para ser claros, ¿incluye esos comentarios en la definición o en la discusión? PD: Edité mi respuesta

— Pburg el

La parte que cité es la discusión. Inmediatamente después de eso, dice (p.22) "Estos dos componentes están incorporados en la siguiente definición" y luego da la definición estándar en términos de mejor respuesta a las estrategias que no menciona creencias en absoluto. Entonces, ¿dónde están las creencias incorporadas en la definición? Y el problema no es solo en juegos con estrategias dominantes. Es bastante posible construir ejemplos donde no hay estrategias dominantes, pero las estrategias de equilibrio de Nash son las mejores respuestas a creencias diferentes del juego de equilibrio.

— Jyotirmoy Bhattacharya

2

Podría estar repitiendo cosas que se han dicho antes, pero aquí está mi opinión sobre esto.

Creo que enfrentamos un problema habitual al comparar dos modelos diferentes. Lo que significa una "equivalencia" no es completamente obvio porque las dos definiciones se encuentran en mundos diferentes o modelos diferentes. Sin embargo, si la "equivalencia" se define adecuadamente, creo que uno puede entender la definición de Osborne y demostrar que es "equivalente" a un NE.

El concepto de solución subyacente a la sección citada sería algo como lo siguiente:

$s^*$ $b^*$ $i$

${tu}_{yo} (s_{yo}^{*} El | s_{- yo} = {si}_{yo}^{*}) \geq {tu}_{yo} (s^{'} El | s_{- yo} = {si}_{yo}^{*}) para todos s^{'} \in S_{yo}$ $u_i ( s^*_i ~|~ s_{-i} = b^*_{i}) \geq u_i ( s' ~|~ s_{-i} = b^*_{i}) \text{ for all } s' \in S_i$ ${si}_{yo}^{*} = s_{- yo}^{*}$ $b^*_i = s^*_{-i}$

$\Leftrightarrow$

$\Rightarrow$

$p$

$\Rightarrow$

Esta es la parte difícil. ¿Qué significa que "cada NE es un BE"? Ciertamente no es que "un NE más cualquier perfil de creencias es un BE", como lo demostró el OP con su contraejemplo. Sin embargo, es el caso de que "cualquier NE puede convertirse en un BE para algún perfil de creencias ". Creo que es en este sentido que uno debería entender la afirmación de "equivalencia" de Osborne

Tenga en cuenta que también tenemos la siguiente declaración más "de equivalencia": "Un resultado del juego es un resultado NE si y solo si es un resultado BE".

— Martin Van der Linden
fuente

Pero cada BE no es un NE ya que el concepto BE es un debilitamiento de la racionalización que somos estrictamente más débiles que el NE.

— Jyotirmoy Bhattacharya

Como escribí, tengo problemas para entender lo que significa para un BE "no ser" un NE porque parecen vivir en diferentes modelos. ¿Quiere decir que algunas estrategias jugadas en un BE no son NE? Pensé que eso era incorrecto, pero podría haber pasado algo por alto. Si eso es lo que quieres decir, ¿podrías señalarme un contraejemplo? Eso sería muy util.

— Martin Van der Linden

No estoy seguro de que BE sea un debilitamiento de la racionalización. A mi entender, BE es racionalización junto con la condición de que las conjeturas sean correctas, ¿verdad? Si eso es correcto, ¿no seríamos más fuertes que la racionalización? (por supuesto, podría depender de lo que se llama un concepto de solución "más débil / más fuerte")

— Martin Van der Linden