¿Cuándo debe un receptor aleatorizar las acciones en un juego de señalización?

Supongamos que hay un juego de señalización con un espacio finito mensaje $M$ , acción finita espacio $A$ , y el espacio tipo finito $T$ . Aún más simple, todos los tipos de remitentes tienen preferencias idénticas (el receptor solo prefiere diferentes acciones en respuesta a diferentes tipos). ¿El receptor puede hacerlo estrictamente mejor aleatorizando las respuestas? Cuando existe un equilibrio donde el receptor solo toma acciones puras?

Ubiquitous resumió muy bien mi pregunta: "¿Alguna vez se da el caso de que el equilibrio con las recompensas más altas del receptor implica necesariamente estrategias mixtas?"

Vayamos con el equilibrio secuencial. Si desea comenzar con alguna notación.

$\sigma_{t}(m)$ es la probabilidad de que $t\in T$ envía $m\in M$ .

$\sigma_R^m(a)$ es la probabilidad de que las responde receptor a $m$ con $a\in A.$ $\mu^m \in \Delta T$ da las creencias del receptor después de observar $m$ .

Un equilibrio secuencial requiere que $\sigma_t$ dé respuestas óptimas dado $\sigma_R$ , $\sigma_R$ es óptimo dado $\mu$ y $\mu$ es Bayesiano dado $\sigma$ . Esta es realmente la definición de un secuencial débil, pero no hay distinción en un juego de señalización.

Mi intuición dice que no cuando existe un equilibrio donde el receptor solo juega acciones puras, pero siempre he sido horrible con este tipo de cosas. Tal vez también tengamos que estipular que no es un juego de suma cero, pero solo lo digo porque recuerdo que los jugadores están mejor con la capacidad de aleatorizar en esos juegos. Tal vez esta es una nota al pie de página en un documento en alguna parte?

Considere el siguiente juego donde las preferencias del remitente no son idénticas. Pido disculpas por la baja calidad. Hay tres tipos de remitentes, cada uno igualmente probable. Podemos crear lo que creo que es el equilibrio óptimo del receptor (jugador 2) solo si se aleatorizan al recibir el mensaje 1. Luego, los tipos 1 y 3 jugarán , creando un equilibrio de separación. Si el receptor usa una estrategia pura en respuesta a , entonces un tipo 1 o 2 se desviaría y empeoraría el receptor. $m_2$ $m_1$

$\sigma_R^{m_1}(a)=.5=\sigma_R^{m_1}(r)=.5$

ingrese la descripción de la imagen aquí

game-theory

— Pburg
fuente

¿Las acciones tomadas por el receptor en función del tipo tienen un impacto en el mensaje enviado por el remitente o son independientes?

— Martin Van der Linden

No estoy exactamente seguro de lo que quieres decir. Hay un tipo de receptor. Su estrategia asigna mensajes en una distribución sobre acciones. Solo tienen un impacto en el mensaje en la medida en que los remitentes están jugando una mejor respuesta.

— Pburg

Suponga que existe un equilibrio en el que el receptor se aleatoriza sobre un conjunto de acciones

. Esto significa, por definición, que debe ser indiferente entre cualquiera de las dos distribuciones de probabilidad sobre

incluidas aquellas en las que todo el peso se pone en una sola acción (estrategias puras). Entonces, no, una estrategia mixta nunca puede ser estrictamente mejor que la mejor estrategia pura. ¿O entendí mal la pregunta?

α

$\alpha$

α

$\alpha$

— Ubicuo

@Ubiquitous Eso tiene sentido para mí, pero me preguntaba si podría haber algunos casos patológicos extraños. Por ejemplo, solo pude encontrar un teorema: "Para las elecciones genéricas de pagos en un juego de formas extensas finitas con recuerdo perfecto, los pagos son constantes en cada componente conectado de equilibrios secuenciales". La advertencia genérica me hizo preguntarme.

— Pburg

@Pburg Sí, ya veo. Parece que teníamos en mente diferentes preguntas. Estaba pensando "¿alguna vez es el caso de que la mejor respuesta única del receptor a una estrategia de remitente dada es una estrategia mixta?", Mientras que parece que su pregunta es en realidad "¿alguna vez es el caso de que el equilibrio con los pagos más altos del receptor necesariamente implique estrategias mixtas?

— Ubicuo

Respuestas:

¡Quizás tenga un contraejemplo!

Que haya tres mensajes, y , y tres tipos de remitente donde $m_1, m_2,$ $m_3$ $t_1,t_2,t_3$ , $\Pr(t=t_3)=\frac{1}{2}-\epsilon$ y $\Pr(t=t_2)=\frac{1}{4}$ . Enviarda como resultado una recompensapara los remitentes, podemos pensar que sale del juego. $\Pr(t=t_1)=\frac{1}{4}+\epsilon$ $m_3$ $0$

El conjunto de respuestas del receptor a un mensaje es $m=m_1,m_2$ $\{a,r\}$

$u_t(a,m_1)=1 > u_t(a,m_2)=\beta>u_t(r,\cdot)=0$

$u_R(t_1,m_1,a)=u_R(t_2,m_2,a)=2$ , , $u_R(t_3,m_i,a)=1$

$u_R(t_2,m_1,a)=u_R(t_2,m_1,a)=0$ , , $u_R(t_3,m_i,r)=2$

$u_R(t_1,m_i,r)=u_R(t_2,m_i,r)=1$ .

Luego, en equilibrio, todos los remitentes deben obtener la misma utilidad, ¿correcto? De lo contrario, uno imitará la estrategia del otro.

Entonces, el único equilibrio de estrategia pura es que todos los remitentes elijan . En un equilibrio de agrupación en o , la mejor respuesta es elegir . No existe una estrategia pura que separe el equilibrio, excepto si y envían , y el receptor responde con . Entonces es indiferente entre todos los mensajes, porque seguramente se encontrará con el pago . Todo esto le da al receptor una recompensa $m_3$ $m_1$ $m_2$ $r$ $t_1$ $t_2$ $m_2$ $r$ $t_3$ $0$ $\frac{3}{2}-\epsilon$

Luego considere el caso donde yAhora, los remitentes son indiferentes entre enviar esos dos mensajes. Luego, deje que y para . Entonces la estrategia del receptor es racional. $\sigma_R^{m_1}(a)=\beta$ $\sigma_R^{m_2}(a)=1.$ $\sigma_{t_3}(m_1)=\frac{\epsilon+1/4}{-\epsilon+1/2}=1-\sigma_{t_3}(m_1)$ $\sigma_{t_i}(m_i)=1$ $i=1,2$

La utilidad esperada del receptor de dado o es 1,5. La utilidad esperada de está ligeramente por encima de 1.5, dado . Por lo tanto, la recompensa esperada ex ante está por encima de , mejor que el equilibrio puro descrito anteriormente. Además, esta separación solo se mantiene mediante la mezcla. Cualquier otra estrategia pura tomada por el receptor inducirá la agrupación del remitente, lo que significa que el único equilibrio de estrategia pura es cuando el receptor elige . $m_1$ $a$ $r$ $m_2$ $a$ $\frac{3}{2}-\epsilon$ $r$

Debería tener s en la imagen a continuación para los pagos del remitente del lado izquierdo a . Creo que el es el ingrediente clave. $\beta$ $a$ $\beta<1$

ingrese la descripción de la imagen aquí

— Pburg
fuente

Creo que esto no puede suceder con los remitentes adversos al riesgo, el receptor neutral al riesgo y lo suficientemente rico. $A$

Por ejemplo, y para apegarse al modelo de señalización canónica, suponga que es la línea real positiva y la utilidad de los remitentes aumenta en mientras que los receptores tienen una utilidad lineal que disminuye en $A$ $u$ $a$ . $a$

(Es cierto que esta es solo una respuesta parcial, ya que el marco es mucho menos general que el de su pregunta, por lo que podría no ser satisfactorio para usted. Todavía proporciono un argumento en caso de que esté de acuerdo con estos supuestos)

$\sigma^m_R(a') > 0$ $\sigma^m_R(a'') > 0$ $a' \neq a'' \in A$

a^{‴} \equiv \frac{σ_{R}^{m} (a^{'})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} a^{'} + \frac{σ_{R}^{m} (a^{″})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} a^{″} .

$a''' \equiv \frac{\sigma^m_R(a')}{\sigma^m_R(a') + \sigma^m_R(a'') } a' + \frac{\sigma^m_R(a'')}{\sigma^m_R(a') + \sigma^m_R(a'') } a''.$

Por aversión al riesgo

u [a^{‴}] > \frac{σ_{R}^{m} (a^{'})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} u (a^{'}) + \frac{σ_{R}^{m} (a^{″})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} u (a^{″}) .

$u[ a''' ] > \frac{\sigma^m_R(a')}{\sigma^m_R(a') + \sigma^m_R(a'') } u(a') + \frac{\sigma^m_R(a'')}{\sigma^m_R(a') + \sigma^m_R(a'') } u(a'').$

[σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})] u (a^{‴}) > σ_{R}^{m} (a^{'}) u (a^{'}) + σ_{R}^{m} (a^{″}) u (a^{″}) .

$[\sigma^m_R(a') + \sigma^m_R(a'')] u( a''' ) > \sigma^m_R(a') u(a') + \sigma^m_R(a'') u(a'').$

Bajo algún supuesto de continuidad, también debe existir

a^{⁗} < a^{‴}

$a '''' < a'''$

tal que

[σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})] u (a^{⁗}) = σ_{R}^{m} (a^{'}) u (a^{'}) + σ_{R}^{m} (a^{″}) u (a^{″}) .

$[\sigma^m_R(a') + \sigma^m_R(a'')] u( a'''' ) = \sigma^m_R(a') u(a') + \sigma^m_R(a'') u(a'').$

Entonces considere construido de la siguiente manera $\sigma^m_R{'}$

$\sigma^m_R{'}(a') = \sigma^m_R{'}(a'') = 0$ ,
$\sigma^m_R{'}(a'''') = \sigma^m_R(a'''') + [\sigma^m_R(a') + \sigma^m_R(a'')]$
Para todos los demás , $\tilde{a}$ $\sigma^m_R{'}(\tilde{a}) = \sigma^m_R(\tilde{a})$

Los receptores preferirían sobre si no alteraran las señales enviadas por los remitentes, ya que implica compensaciones esperadas más bajas. Pero por construcción, los remitentes son indiferentes entre y , por lo que deben enviar las mismas señales que en . Por lo tanto, no puede ser un equilibrio que muestre que no podemos tener dos acciones diferentes jugadas con probabilidad positiva en un equilibrio. $\sigma^m_R{'}$ $\sigma^m_R$ $\sigma^m_R{'}$ $\sigma^m_R$ $\sigma^m_R$ $\sigma^m_R$

— Martin Van der Linden
fuente

En este modelo, ¿el receptor no elegiría siempre a ?

a = 0

$a=0$

— Pburg

No, este es necesariamente el caso. Si el receptor siempre elige sin importar la señal, no incentiva los tipos "altos" para revelar su tipo a través de una señal "más alta". Esto puede ser óptimo en un equilibrio de agrupamiento, pero no en un equilibrio de separación. Vea, por ejemplo, la sección 13.C de Mas-Colell, Whinston y Green, aunque la configuración es nuevamente un poco diferente a la suya (por ejemplo, hay dos empresas que compiten por los trabajadores de diferentes tipos)

a

$a$

— Martin Van der Linden

¿Qué significa "la utilidad lineal del receptor que disminuye en un" significa entonces?

— Pburg

Lo siento, eso no estaba muy claro. En el modelo de señalización de Spence que tengo en mente, la acción que realiza el receptor consiste en pagar un salario w al remitente. La utilidad del receptor depende del tipo de remitente t, menos el salario pagado t − w. Básicamente, el receptor es neutral al riesgo: solo le importa el salario esperado que tendrá que pagar y el tipo esperado que empleará.

— Martin Van der Linden

Bien, supongo que he visto esto como pérdida cuadrática,Gracias por la sugerencia, aunque estoy buscando algo un poco más general pero con acciones discretas.

- (t - w)^{2} .

$-(t-w)^2.$

— Pburg