Esta reciente pregunta de teoría de juegos me hizo pensar (esto es una tangente, por supuesto): ¿es posible optimizar eficientemente una estrategia personal para elegir preguntas de investigación para trabajar en el uso de la teoría de juegos?
Para avanzar hacia una formalización de la pregunta, haré los siguientes supuestos (declarados informalmente):
- Igualmente "disfruto" cualquier problema particular disponible para que yo pueda trabajar (para evitar la respuesta "suave" (¡y correcta!) De "¡Haz lo que quieras!").
- Puedo o no tener éxito en encontrar una respuesta a cualquier problema en el que decida trabajar. Para cualquier problema, tengo una estimación de la probabilidad de cuán bueno seré para resolver un problema (después de invertir tiempo en él).
- Mi objetivo es maximizar mi recompensa cuando me evalúan en el futuro (solicitar un trabajo, solicitar la tenencia, solicitar una beca, etc.), que es una función de cuántos problemas resuelvo y cuán importantes o difíciles son los problemas . No tengo una idea clara de los pagos exactos por problema, pero puedo hacer una estimación razonable.
- Hay una relación inversa floja entre el pago del problema y la dificultad del problema. Otra declaración de mi objetivo es "jugar" las diferencias (es decir, buscar "fruta baja").
- Una instancia de este problema general se especifica mediante una lista de preguntas de investigación (posiblemente infinitas en número), a la que adjunto firmemente (sin costo computacional; se da como entrada) una estimación del valor de la pregunta y la dificultad de la pregunta. Estoy jugando este juego contra un adversario (la persona que me evalúa); la naturaleza decide, dada la probabilidad de que resuelva un problema dado, si lo resuelvo con éxito después de elegir intentarlo.
En un esfuerzo por formalizar realmente lo que está sucediendo (y eludir las respuestas poco interesantes o argumentativas / de tipo debate), veré este problema como un juego de forma extensa con información incompleta con un conjunto de acciones infinito .
Pregunta : Supongo que los juegos de este tipo no son computables de manera eficiente. Sin embargo, ¿existe un algoritmo de tiempo polinómico para maximizar aproximadamente mi recompensa? ¿Qué pasa con un PTAS?
O, alternativamente, ¿hay un modelo teórico de juego más preciso para este problema? Si es así, la misma pregunta es válida: ¿puedo (aproximadamente) maximizar mi pago de manera eficiente? ¿Si es así, cómo?