¿Qué modelo teórico paralelo es más cercano al modelo de programación CUDA / OpenCL?
Por ejemplo, se ajusta en cierto grado al modelo genérico de Máquina de acceso aleatorio paralelo (PRAM). Sin embargo, eso es demasiado genérico, ya que hace abstracción de varias latencias de acceso a memoria y problemas de sincronización.
Mi pregunta es cuál es el modelo teórico en el que la arquitectura CUDA se ajusta más (teniendo en cuenta el paralelismo jerárquico de hilos y bloques de hilos que cooperan).