Estoy investigando cómo funciona la mayoría de las bibliotecas GUI aceleradas por hardware. En realidad, solo me interesan los backends de renderizado aquí. Estoy tratando de descubrir cuál sería la mejor manera de intentar escribir el mío como una especie de proyecto paralelo. Estoy tratando de obtener el máximo rendimiento aquí en lugar de características demasiado sofisticadas. Quiero poder dibujar primitivas, texto y animación.
Algunas buenas bibliotecas que conozco son Qt, Skia y Cairo (aunque no estoy seguro de cuál es el estado de HWA). También he mirado a NanoVG, que es una pequeña biblioteca que parece tener un seguimiento decente. Sin embargo, no pude lograr un rendimiento decente con NanoVG ...
Lo único que me llamó la atención fue que todas estas bibliotecas parecen hacer uso del concepto de "pintura", donde parece que cada forma primitiva se dibuja desde cero una y otra vez. Lo que quiero decir con eso es que, desde las API, no parece que las formas se hayan creado como "objetos" en la GPU o lo que sea la terminología y luego se dejen allí para que se representen "automáticamente". En otras palabras, no se dejan en la memoria de la GPU por ser redibujados en algún bucle grande. Para elaborar, parece que para cada rectángulo, es decir, que necesita dibujarse, se configura un estado OpenGL completo solo para representar ese rectángulo y luego se destruye nuevamente. Sin embargo, parece que estas formas renderizadas se representan al menos en sus destinos finales, lo que permite que la GPU componga toda la escena.
La forma en que esperaba que funcionaran estas bibliotecas es almacenando toda la escena en la GPU (disculpe la horrible terminología). Por ejemplo, las primitivas se triangularían y se dejarían en la memoria, donde después de un proceso complejo se utilizaría para tener un bucle de representación principal para la escena. Además, habría mecanismos para actualizar los atributos o eliminar o agregar primitivas. Esta es una descripción bastante vaga, pero creo que entiendes la idea.
Lo que me gustaría preguntar ahora es si hay algún beneficio de rendimiento para el enfoque de "pintura" en comparación con el enfoque de "guardado" (de nuevo, no tengo idea si hay nombres propios para estas cosas ...). ¿Algunos mecanismos de almacenamiento en caché complejos tal vez? ¿O es mucho más sencillo trabajar con esto?
Me doy cuenta de que el enfoque "guardado" podría usar más memoria en la GPU, pero ¿todas las llamadas de OpenGL necesarias para el enfoque de "pintura" no son muy caras? Supongo que uno podría compensar esto almacenando en caché las formas renderizadas, pero ¿la GPU realmente proporciona uno con un beneficio tan grande al hacer una rasterización tan única (o no muy regular) en comparación con la CPU, especialmente dada la comunicación ¿gastos generales? Además, ¿esta sobrecarga de comunicación no plantea serios problemas para las animaciones cuando se debe dibujar para cada cuadro?
Estoy bastante seguro de que NanoVG no tiene un mecanismo de almacenamiento en caché interno y supongo que esto podría ser responsable de su rendimiento mediocre. Qt, por otro lado, parece tener un excelente rendimiento, por lo que debe estar haciendo algo bien. Google también parece ser capaz de darle un buen uso a Skia.
PD. No soy un profesional de ningún tipo y recientemente comencé a aprender OpenGL.
EDITAR: ¿Otra posibilidad que he pensado es que tal vez el enfoque de "pintura" se consideró necesario simplemente por los beneficios de la memoria? La razón por la que creo que es porque todas estas bibliotecas, por supuesto, se iniciaron en una era diferente y también se dirigen a plataformas integradas, lo que significa que la memoria de la GPU podría ser tan escasa en las plataformas de destino (ed) y que usar la menor cantidad posible podría ser Más importante que el rendimiento. Sin embargo, una vez más, en una situación como esta, no estoy convencido de que la rasterización de GPU cuadro por cuadro dada la sobrecarga de comunicación supere a una CPU, especialmente teniendo en cuenta el recuento de píxeles probablemente bajo en plataformas con tan poca memoria.
Además, he leído en http://blog.qt.io/blog/2010/01/06/qt-graphics-and-performance-opengl/ que Qt aparentemente combina el código de sombreador de segmentos precodificados en tiempo de ejecución antes de "pintar" y luego espera que el compilador OGL incorpore el código correctamente en tiempo de ejecución. Esto me parece aún más sobrecarga de inicialización OGL ...