No debería ser demasiado complicado de hacer. No he leído el artículo mencionado, aquí está mi receta:
Codificadores automáticos variacionales
Demostración en línea con caras morphing:
http://vdumoulin.github.io/morphing_faces/online_demo.html
y https://jmetzen.github.io/2015-11-27/vae.html para el codez.
Básicamente, esto le brinda una forma de parametrizar el 'estilo' en su caso, por ejemplo, cuán ancho o borroso debe ser el trazo del pincel. Cosas que dependen del estilo particular que intentes emular.
En el ejemplo anterior, diferentes caras 'transformadas' o 'imaginadas' son función de los parámetros en el espacio latente. En la imagen a continuación, eso sería lo que obtienes al cambiar cosas en el nivel de 'código'.
Aquí está la idea básica: imagen original a la izquierda, versión estilizada de la misma imagen a la derecha:
Ahora, en teoría, si entrenara un modelo de este tipo en una imagen normal y una imagen estilizada como objetivo y añadiera circunvoluciones, debería poder aprender los filtros del núcleo que corresponden al tipo de "pinceladas" que utiliza el artista .
Por supuesto, eso significa que necesita tener algunos ejemplos de imágenes en versiones originales y estilizadas. Tal conjunto de datos sería bueno para donar a la comunidad; si terminas haciendo esto, me encantaría ver este tipo de trabajo.
¡Buena suerte!
El artículo wiki sobre codificadores automáticos sería un buen punto de partida:
https://en.wikipedia.org/wiki/Autoencoder