Por lo general, para las imágenes, el conjunto de características son los valores de densidad de píxeles y, en este caso, dará lugar a un conjunto de características bastante grande; tampoco se recomienda el muestreo descendente de las imágenes, ya que puede perder (en realidad perderá) datos importantes.
[1] Pero existen algunas técnicas que pueden ayudarlo a reducir el tamaño del conjunto de características, enfoques como PCA (Análisis de componentes principales) lo ayuda a seleccionar un subconjunto de características importantes.
Para obtener información detallada, consulte el enlace http://spark.apache.org/docs/latest/ml-features.html#pca .
[2] Aparte de eso para reducir el gasto computacional durante el entrenamiento de su red neuronal, puede usar el Descenso de gradiente estocástico, en lugar del uso convencional del enfoque de Descenso de gradiente, que reduciría el tamaño del conjunto de datos requerido para el entrenamiento en cada iteración. Por lo tanto, el tamaño de su conjunto de datos que se utilizará en una iteración se reduciría, lo que reduciría el tiempo requerido para capacitar a la red.
El tamaño de lote exacto que se utilizará depende de su distribución para el conjunto de datos de entrenamiento y el conjunto de datos de prueba, un uso más general es 70-30. Donde también puede utilizar el enfoque estocástico mencionado anteriormente para reducir el tiempo requerido.
Detalle de Descenso de gradiente estocástico http://scikit-learn.org/stable/modules/sgd.html
[3] El hardware parece apto para la actualización sería necesario, pero si es necesario, busque soluciones en la nube como AWS, donde puede obtener una suscripción gratuita a la cuenta hasta un límite de uso.