El mejor enfoque es recopilar tantos datos como sea posible. Luego comience con el proyecto y haga un modelo de datos.
Ahora puede evaluar su modelo para ver si tiene un sesgo alto o una varianza alta.
Alta varianza : en esta situación, verá que el error de validación cruzada es mayor que el error de entrenamiento después de la convergencia.
Alto sesgo : en esta situación, el error de validación cruzada es ligeramente mayor que el error de entrenamiento, que en sí mismo es alto cuando se traza contra el tamaño de los datos de entrenamiento. y errores de trama.
Si ve que su modelo tiene una alta varianza (sobreajuste), agregar más datos generalmente ayudará en contraste con el modelo de alto sesgo (falta de ajuste) donde agregar nuevos datos de entrenamiento no ayuda.
Además, por clase, debe intentar obtener el mismo número de imágenes; de lo contrario, los conjuntos de datos pueden quedar sesgados (más de un tipo).
También sugiero que si está utilizando TensorFlow , lea más sobre el Clasificador de imágenes INCEPTION de GOOGLE . Ya es un clasificador entrenado en la base de datos de imágenes de Google y puede usarlo para sus imágenes, de esa manera los requisitos para la cantidad de imágenes se reducen drásticamente.