1
Bandido multi armado para la distribución general de recompensas
Estoy trabajando en un problema de bandidos multibrazos en el que no tenemos información sobre la distribución de recompensas. He encontrado muchos documentos que garantizan límites de arrepentimiento para una distribución con límite conocido y para distribuciones generales con soporte en [0,1]. Me gustaría saber si hay una manera de …