DeepMind afirma que su red Q profunda (DQN) pudo adaptar continuamente su comportamiento mientras aprendía a jugar 49 juegos de Atari.
Después de aprender todos los juegos con la misma red neuronal, ¿fue el agente capaz de jugarlos todos a niveles 'sobrehumanos' simultáneamente (siempre que se presentara aleatoriamente uno de los juegos) o podría ser bueno solo en un juego a la vez porque cambiaba? requiere un nuevo aprendizaje?