Es poco probable que esto agregue mucho más allá de sus esfuerzos directos de recopilación de datos.
La calidad de los resultados actuales de GAN (a partir de 2017) no será lo suficientemente alta. Las imágenes producidas por una GAN suelen ser pequeñas y pueden tener detalles inusuales / ambiguos y distorsiones extrañas. En el documento que vinculó, las imágenes generadas por el sistema a partir de una oración tienen bloques de color creíbles dado el tema, pero sin la oración preparándole qué esperar, la mayoría de ellas no son reconocibles como ningún tema específico.
Las GAN con un propósito menos ambicioso que generar imágenes a partir de oraciones (que a pesar de mis críticas anteriores, una hazaña realmente notable de la OMI) deberían producir imágenes más cercanas a las realistas. Pero su alcance será menor y probablemente no incluya el tipo de imagen deseado. Además, por lo general, el tamaño de salida es pequeño, por ejemplo, 64x64 o 128x128 *, y todavía hay suficientes distorsiones y ambigüedades para que las fotos originales de verdad sean mucho más preferibles.
La GAN está limitada por la biblioteca de capacitación disponible; no funcionará bien si intenta generar imágenes fuera del alcance de sus datos de capacitación. Los resultados que se muestran en el trabajo de investigación, por supuesto, se centran en el dominio proporcionado por los datos de capacitación. Pero no puedes alimentar a cualquiera introducir oración en este modelo y esperar un resultado que sería útil en otro lugar.
Si encuentra una GAN que ha sido capacitada en un conjunto de datos adecuado para su problema, entonces es mejor que intente obtener los mismos datos directamente para su proyecto.
Si se enfrenta a un problema con datos limitados de verdad sobre el terreno, entonces quizás un mejor enfoque para usar una GAN sería utilizar un clasificador previamente entrenado como VGG-19 o Inception v5, reemplazar las últimas capas completamente conectadas, y bien sintonice sus datos. Aquí hay un ejemplo de cómo hacerlo usando la biblioteca Keras en Python ; se pueden encontrar otros ejemplos con búsquedas como "ajustar el clasificador de imágenes CNN".
* Las GAN de última generación han mejorado desde que publiqué esta respuesta. Un equipo de investigación en Nvidia ha tenido un éxito notable al crear imágenes fotorrealistas de 1024x1024 . Sin embargo, esto no cambia los otros puntos en mi respuesta. Las GAN no son una fuente confiable de imágenes para las tareas de clasificación de imágenes, excepto tal vez para subtareas de lo que sea que la GAN ya haya recibido capacitación y sea capaz de generar condicionalmente (o tal vez de manera más trivial, para proporcionar datos fuente para "otras" categorías en clasificadores).