¿Alguien puede decirme cómo se supone que debo construir una red neuronal utilizando el método por lotes?
He leído que, en el modo por lotes, para todas las muestras en el conjunto de entrenamiento, calculamos el error, los delta y, por lo tanto, los pesos delta para cada neurona en la red y luego, en lugar de actualizar inmediatamente los pesos, los acumulamos y luego, antes de comenzar En la próxima época, actualizamos los pesos.
También leí en alguna parte que, el método por lotes es como el método en línea, pero con la diferencia de que uno solo necesita sumar los errores para todas las muestras en el conjunto de entrenamiento y luego tomar el promedio y luego usarlo para actualizar los pesos como uno lo hace en el método en línea (la diferencia es solo ese promedio) así:
for epoch=1 to numberOfEpochs
for all i samples in training set
calculate the errors in output layer
SumOfErrors += (d[i] - y[i])
end
errorAvg = SumOfErrors / number of Samples in training set
now update the output layer with this error
update all other previous layers
go to the next epoch
end
- ¿Cuál de estos es realmente la forma correcta del método por lotes?
- En el caso del primero, ¿no se acumulan todos los pesos delta en un número enorme?