Complejidad de los juegos de información parcial de estado finito


12

Dado un juego determinista de suma cero de información parcial con solo un número finito de estados,
cuyos posibles resultados son [perder, empatar, ganar] con valores [-1,0, + 1] respectivamente,
¿cuál es la complejidad de aproximar el valor de tales un juego aditivamente dentro de ?ϵ

En particular, no puedo encontrar ningún algoritmo para hacerlo.
El resto de esta publicación se dedica por completo a dar una descripción más completa
del problema, por lo que si ya puede entender qué significa la pregunta en la parte superior
de esta publicación, entonces no hay razón para que lea el resto de esta publicación.

Dada una máquina árbitro con estados , con un estado inicial designado s 0 , un estado s a cuyo par de puntaje es [ - 1 , + 1 ] , un estado s b cuyo par de puntaje es [ + 1 , - 1 ] y estados de la forma{1,2,3,...,S}s0sa[1,+1]sb[+1,1]

donde:[p1_info,p2_info,num_of_choices,player_to_move,next_state_table]

  • player_to_move{1,2}
  • es una función de { 1 , 2 , 3 , . . . , Num_of_choices } { 1 , 2 , 3 , . . . , S }next_state_table{1,2,3,...,num_of_choices}{1,2,3,...,S}
  • p1_info,p2_info,num_of_choices1

Cuando la máquina está en un estado de esa forma:

  • envía a Player_1 y envía p2_info a Player_2,p1_infop2_info
  • envía al jugador indicado, espera a que un elemento de { 1 , 2 , 3 , . . . , num_of_choices } como entrada de ese jugador,num_of_choices{1,2,3,...,num_of_choices}
  • luego pasa al estado indicado por next_state_table

Cuando la máquina entra en uno de los otros dos estados o s b ,sasb

  • se detiene con el par de puntaje de ese estado como salida

Hay un juego natural de dos jugadores: la máquina de árbitro se inicia en el estado , los jugadores proporcionan las entradas que la máquina de árbitro espera, si la máquina de árbitro se detiene, entonces el Jugador 1 obtiene el primer valor del par de salida de la máquina y el jugador 2 puntúa el segundo valor del par de salida de la máquina; de lo contrario, ambos jugadores puntúan 0. s0=1





¿Cuál es la complejidad del siguiente problema?
Dada tal máquina de árbitro y un número entero positivo N, genera un número racional
que está (aditivamente) dentro de 1 / N del valor del juego natural para el Jugador 1.

Como se mencionó anteriormente en esta pregunta, no puedo encontrar
ningún algoritmo para hacerlo.


¿Los jugadores conocen la estructura interna? ¿Cuál es la ventaja de tener información adicional, da más movimientos posibles?
domotorp

Si. Les da una mejor idea de cuál es el estado actual.

Lo siento pero aún no lo entiendo. ¿Entonces conocen la estructura interna pero no saben dónde están en este momento? Deje en claro la descripción, estoy seguro de que no soy el único que no puede entender el problema.
domotorp

3
¿Es su modelo lo mismo que un "juego estocástico basado en turnos de suma cero con información parcial"?
Kristoffer Arnsfelt Hansen

1
@Kristoffer: No es obvio (al menos para mí) que mi modelo permita la codificación probabilidades irracionales, aunque mi modelo es equivalente a ese.

Respuestas:


6

NOTA: mi supuesto algoritmo era incorrecto; Lo borré.

pp

Para una cota inferior de la complejidad, la cuestión de la aproximación del valor de un simple juego estocástico se no sabe que estar en P . Usando el truco de aleatorización que di anteriormente, es fácil escribir un juego estocástico simple como un juego arbitrado con una tabla de búsqueda de tamaño polinómico.


Esa idea de aleatorización (al menos, como la describiste) solo puede dar probabilidades racionales. Además, las definiciones utilizadas en los primeros dos documentos que vinculaste también implican que sus juegos tienen un árbol de juego finito, mientras que solo necesito un espacio de estado finito (donde "estado" no incluye la historia del juego).

Tienes razón ... la primera parte de mi respuesta es incorrecta. Déjame borrarlo. Estoy bastante seguro de que no se sabe que aproximar el valor de los juegos estocásticos simples esté en P, incluso cuando todos los lanzamientos de monedas tienen una probabilidad de 1/2.
Peter Shor

1


ϵ0<ϵ

Entrada: un juego como se describe en mi pregunta
debe generar SÍ si: el valor del juego para el Jugador 1 es mayor que 1-ϵ
ϵ

permanece RE- duro incluso cuando

player_to_move siempre es 1 (es decir, solo se necesita 1 jugador)
y
s 0 ≠ s a y s a no está en Range (next_state_table)
(es decir, es literalmente imposible que el jugador pierda)
y
p1_info y p2_info y number_of_choices son independientes del estado
(es decir, el único comentario del jugador es si acaba de ganar o no)

.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.