Como la GAN consta de dos partes: el generador y el discriminador, hay dos formas de utilizar GAN como extractor de funciones:
- Generador basado en la forma presentada por Mikhail Yurasov.
- Discriminador basado en la forma presentada por Kenny.
La segunda forma es más controvertida. Algunos estudios [1] pensaron que, intuitivamente, como el objetivo del discriminador es distinguir las muestras generadas de las muestras reales, solo se centrará en la diferencia entre estos dos tipos de muestras. Pero lo que tiene sentido es la diferencia entre las muestras reales, que son las muestras utilizadas por las tareas posteriores.
Intenté estudiar esto y descubrí que la característica extraída se puede factorizar en dos subespacios ortogonales . El primer espacio contribuye a la tarea discriminadora, mientras que el segundo está libre de ella. Como en la mayoría de los casos, las características utilizadas para distinguir las muestras reales de las generadas son ruido, el segundo espacio de características estará libre de ruido. Desde esta perspectiva, aunque la tarea del discriminador no se centrará en la diferencia entre muestras reales, que son útiles para las tareas posteriores, las funciones libres de ruido contenidas en el segundo subespacio funcionarán.
[1] Jost Tobias Springenberg. Aprendizaje no supervisado y semi-supervisado con redes adversas generativas categóricas. arXiv: 1511.06390 [cs, stat], abril de 2016. preimpresión de arXiv. arXiv: 1511.06390 [stat.ML]. Ithaca, Nueva York: Biblioteca de la Universidad de Cornell.