Estoy leyendo el artículo fundamental Aprendizaje de secuencia a secuencia con redes neuronales de Ilya Sutskever y Quoc Le. En la primera página, menciona brevemente que:
A surprising example of the power of DNNs is their ability to sort
N N-bit numbers using only 2 hidden layers of quadratic size
¿Alguien puede describir brevemente cómo ordenar números usando solo 2 capas ocultas?