Respuestas:
A partir de 2012, su mejor opción fue implementar su cálculo como un sombreador de fragmentos en GLSL ES y encontrar una manera de representar la salida como una textura RGBA (32 bits).
Eben declaró en esta charla de 2012 que no es probable que se implemente OpenCL, pero que puede haber una API desarrollada en el futuro; la respuesta comienza a las 21:20 , y Eben dice "podemos proporcionar alguna forma para que las personas obtengan parte de ese cálculo de propósito general".
Desarrollos recientes, como el proyecto VC4CL, han intentado implementar OpenCL en la GPU VideoCore IV utilizada por Raspberry Pi, y otros proyectos relacionados ahora brindan acceso a parte de la potencia de cómputo general de la GPU.
Actualmente no, solo hay una interfaz de framebuffer para fines de visualización. No hay OpenCL y no hay planes para ello ni hay documentación disponible para crear OpenCL. CUDA es Nvida solo, así que no es aplicable. Una vez que un controlador OpenGL esté disponible, puede diseñar algunos cálculos a través de la GPU, pero aún queda por ver qué tan útil será.
Echa un vistazo a este hilo detallado en el foro RPi: GPU Processing API
Este puede ser útil. Biblioteca GPGPU python para la frambuesa pi. https://github.com/nineties/py-videocore
Una GPU de propósito general (GPGPU) es una unidad de procesamiento de gráficos (GPU) que realiza cálculos no especializados que normalmente realizaría la CPU
Puede escribir programas de alto nivel que se ejecuten en la GPU de Pi usando QPULib:
https://github.com/mn416/QPULib
Es un lenguaje de programación y un compilador dirigido a los 12 procesadores vectoriales (QPU) dentro de la GPU de Pi. Su objetivo es ser fácil de usar y se implementa como un EDSL (Lenguaje específico de dominio incorporado), una alternativa liviana a un backend completo de OpenCL.
La fundación Raspberry Pi ha sido avalando GPGPU en el PI desde 2014, poco después de Broadcom lanzado la documentación para las unidades QPu dentro de la GPU.
Simon J. Hall creó el compilador experimental de OpenCL (el ganador de la estrecha competencia de $ 10,000 de 2014 para hacer que Quake funcione de manera aceptable sin usar el BLOB de GPU): ver aquí .