El problema clave con las redes neuronales tiende a evitar el sobreajuste. La regularización bayesiana (que restringe la magnitud de los pesos) es un enfoque para esto, la estabilización estructural (es decir, restringir el número de nodos ocultos y / o pesos es otro). Ninguno de los dos enfoques es una panacea, y generalmente una combinación de regularización y estabilización estructural es mejor (lo que significa que necesita una validación cruzada nuevamente para seleccionar la arquitectura de red; usar la evidencia bayesiana para esto es una mala idea ya que la evidencia está sesgada como resultado de su uso en el ajuste de los parámetros de regularización y poco confiable si hay alguna especificación errónea del modelo). Lo que funciona mejor depende esencialmente del problema, y la mejor manera de averiguarlo es probar ambos y ver (usar, por ejemplo, validación cruzada para estimar el rendimiento de manera imparcial).
Además, la regularización no tiene que ser bayesiana, puede elegir cuánto regularizar la red mediante la validación cruzada. Uno de los problemas con los métodos bayesianos es que pueden dar malos resultados si el modelo no se especifica correctamente, en cuyo caso los métodos de regularización basados en validación cruzada pueden ser más sólidos.
Otro punto importante es que no todas las formulaciones de redes neuronales bayesianas son iguales. El marco de evidencia de MacKay tiende a no funcionar bien para problemas de clasificación, ya que la aproximación de Laplace que utiliza no funciona muy bien para distribuciones posteriores sesgadas para los pesos. Es probable que el enfoque MCMC de Radford Neal funcione mejor para estas tareas, pero es computacionalmente costoso y evaluar la convergencia, etc., no es tan sencillo.
Sin embargo, los modelos de redes neuronales son bastante complicados de entender y, en la práctica, es más fácil obtener un buen rendimiento de generalización de los métodos del núcleo o procesos gaussianos, por lo que los usaría en su lugar para la mayoría de las tareas, especialmente si hay relativamente pocos datos de entrenamiento.
Hice un estudio empírico muy extenso sobre esto recientemente, pero necesito encontrar una revista que acepte estudios empíricos de interés para los profesionales, pero con muy poco contenido nuevo de investigación.