Respuestas:
Formalmente, una sola capa oculta es suficiente para aproximar una función continua a cualquier grado deseado de precisión, por lo que, en ese sentido, nunca necesita más de 1. Esto se llama Teorema de Aproximación Universal .
Encontrar la mejor topología para un problema dado es un problema de investigación abierto. Hasta donde yo sé, hay pocas 'reglas generales' universales para esto.
Para un problema dado, una opción es aplicar un enfoque neuroevolutivo como NEAT , que intenta encontrar una topología que funcione bien para el problema en cuestión.