El ensacado es la generación de múltiples predictores que funciona como un conjunto de predictores únicos. La deserción es una técnica que enseña a las redes neuronales a promediar todas las subredes posibles. Mirando las competencias más importantes de Kaggle parece que estas dos técnicas se usan juntas muy a menudo. No puedo ver ninguna diferencia teórica además de la implementación real. ¿Quién puede explicarme por qué deberíamos usar ambos en cualquier aplicación real? ¿Y por qué el rendimiento mejora cuando los usamos a ambos?