1
Elegir un tamaño de minibatch apropiado para el descenso de gradiente estocástico (SGD)
¿Existe alguna literatura que examine la elección del tamaño del minibatch al realizar el descenso de gradiente estocástico? En mi experiencia, parece ser una opción empírica, que generalmente se encuentra a través de la validación cruzada o el uso de diferentes reglas generales. ¿Es una buena idea aumentar lentamente el …