Soy un principiante tratando de armar mi primer proyecto. Tenía en mente un proyecto de clasificación de canciones, pero dado que etiquetaría manualmente, solo podía reunir alrededor de 1000 canciones o 60 horas de música.
Estaría clasificando con varias clases, por lo que es posible que una clase tenga tan solo 50-100 canciones en el conjunto de entrenamiento, ¡esto parece muy poco! ¿Existe una regla general para la cantidad de datos que se necesitan para entrenar una red neuronal para que funcione?
Editar: Estaba pensando en usar un LSTM de vainilla. Las características de entrada tendrán dimensión 39, dimensión de salida 6, mi primer intento de dimensión de capa oculta sería 100.
