Estoy usando la GPU NVIDIA Quadro K2000. Corrí deviceQuery.exe
, cuyos resultados están a continuación. Dice que solo tengo 2 unidades SM. No estoy seguro si realmente tengo solo 2 SM o si algunos de mis SM están deshabilitados como se menciona en el tercer comentario en esta pregunta SO .
También vi que la cantidad de SP son 192 por SM. Puede haber alguna forma de habilitar más SM y luego la cantidad de SP por SM disminuirá.
Actualización: La razón por la que pregunto es el hecho de que quiero que mi procesamiento de GPU sea eficiente. Tengo una imagen de 1080 x 1920 que he dividido en tres segmentos. Estoy transfiriendo estos segmentos H2D, procesando y transfiriendo D2H de forma asincrónica. Por lo tanto, quiero elegir una dimensión de bloques y una cantidad de subprocesos por bloque que pueda utilizar de manera eficiente la configuración de hardware de mi GPU. Además, todavía estoy confundido de que una GPU que tenga más de 2 SM (digamos 8 SM) pero menos cantidad de SP por SM (384/8 = 48 SP por SM) tenga el mismo rendimiento que una GPU que tenga 2 SM y 192 SP por SM? Quiero decir, ¿es el número total de SP disponibles lo que importa?