4
Sin término de regularización para la unidad de sesgo en la red neuronal
De acuerdo con este tutorial sobre aprendizaje profundo , la pérdida de peso (regularización) generalmente no se aplica a los términos de sesgo b ¿por qué? ¿Cuál es el significado (intuición) detrás de esto?