Suponga que quiere ir a pescar al lago cercano de 8 a.m. a 8 p.m. Debido a la sobrepesca, se ha establecido una ley que dice que solo puede pescar un pez por día. Cuando pescas un pez, puedes optar por mantenerlo (y así ir a casa con ese pez), o tirarlo de vuelta al lago y continuar pescando (pero te arriesgas a establecerte más tarde con un pez más pequeño o sin pez). Quieres atrapar un pez lo más grande posible; específicamente, desea maximizar la masa esperada de pescado que lleva a casa.
Formalmente, podríamos configurar este problema de la siguiente manera: los peces se capturan a una cierta velocidad (por lo tanto, el tiempo que lleva capturar su próximo pez sigue una distribución exponencial conocida), y el tamaño de los peces capturados sigue una distribución (también conocida) . Queremos un proceso de decisión que, dada la hora actual y el tamaño de un pez que acaba de atrapar, decida si desea conservar el pez o devolverlo.
Entonces la pregunta es: ¿cómo se debe tomar esta decisión? ¿Hay alguna forma simple (o complicada) de decidir cuándo dejar de pescar? Creo que el problema es equivalente a determinar, durante un tiempo t, qué masa esperada de peces se llevaría a casa un pescador óptimo si comenzaran en el tiempo t; el proceso de decisión óptimo mantendría a un pez si y solo si el pez es más pesado que la masa esperada. Pero eso parece una especie de autorreferencial; Estamos definiendo la estrategia de pesca óptima en términos de un pescador óptimo, y no estoy muy seguro de cómo proceder.