Estoy usando el modelo preformado de TensorFlow de la red neuronal convolucional.
https://github.com/tensorflow/models/blob/master/slim/nets/resnet_v2.py#L130
Encontré la siguiente oración:
Sin embargo, para tareas de predicción densas, recomendamos que se utilicen entradas con dimensiones espaciales que sean múltiplos de 32 más 1, por ejemplo, [321, 321].
¿Alguien sabe cuál es la predicción densa en esta literatura?
1
"En la visión por computadora, la predicción densa en píxeles es la tarea de predecir una etiqueta para cada píxel en la imagen". semanticscholar.org/paper/…
—
DaL