¿Cómo habilitar los procesadores de transmisión (SM) deshabilitados?


-1

Estoy usando la GPU NVIDIA Quadro K2000. Corrí deviceQuery.exe, cuyos resultados están a continuación. Dice que solo tengo 2 unidades SM. No estoy seguro si realmente tengo solo 2 SM o si algunos de mis SM están deshabilitados como se menciona en el tercer comentario en esta pregunta SO .

También vi que la cantidad de SP son 192 por SM. Puede haber alguna forma de habilitar más SM y luego la cantidad de SP por SM disminuirá.

imagen

Actualización: La razón por la que pregunto es el hecho de que quiero que mi procesamiento de GPU sea eficiente. Tengo una imagen de 1080 x 1920 que he dividido en tres segmentos. Estoy transfiriendo estos segmentos H2D, procesando y transfiriendo D2H de forma asincrónica. Por lo tanto, quiero elegir una dimensión de bloques y una cantidad de subprocesos por bloque que pueda utilizar de manera eficiente la configuración de hardware de mi GPU. Además, todavía estoy confundido de que una GPU que tenga más de 2 SM (digamos 8 SM) pero menos cantidad de SP por SM (384/8 = 48 SP por SM) tenga el mismo rendimiento que una GPU que tenga 2 SM y 192 SP por SM? Quiero decir, ¿es el número total de SP disponibles lo que importa?


Es completamente posible que las unidades adicionales se deshabiliten mediante el láser de ciertos enlaces importantes en el chip físico y no se puedan volver a habilitar de ninguna manera a través de software o hardware. Es muy probable que esto evite el tipo de cosas que desea. Si bien algunos de esos SM pueden ser funcionales además de estar deshabilitados, también es posible que estén deshabilitados porque no funcionaron correctamente durante la prueba. Es mucho más simple y fácil comprar lo que realmente necesita en lugar de lo más barato y con la esperanza de poder volver a habilitar las piezas deshabilitadas.
Mokubai

@Mokubai: NVIDIA Quadro K2000 tiene capacidad 3.0. Es casi una nueva generación de GPU. ¿Realmente crees que debería tener solo 2 SM? Siempre que leo sobre las GPU, dicen que las GPU generalmente tienen de 2 a 30 SM. Y no puedo creer que esta última GPU tenga solo 2 SM.
skm

1
Dado que el K2000 está en el lado del "cubo de ganga" de la línea Quadro, nada me sorprendería. Consulte en.wikipedia.org/wiki/… para confirmar que tiene 2 unidades SMX funcionales . Lo más probable es que tenga un chip que tenga muchas más unidades SMX, pero es probable que estén físicamente desactivadas, ya sea porque están defectuosas o porque las pistas están cortadas con láser.
Mokubai

Su "último" GK107 tiene, de hecho, más de tres años, es una parte fundamental y tiene exactamente 2 SMX, cada uno con 192 núcleos: tomshardware.com/reviews/geforce-gt-640-review,3214.html ( su K2000 es solo una versión Quadro de esta tarjeta). Y no hay comandos mágicos de software que le digan a los transistores en el silicio que se reorganicen. ¿Son todas estas preguntas que solo los compradores lamentan o tiene una razón subyacente para hacer esta pregunta?
talonmies

@talonmies: No escribí la razón de hacer esta pregunta porque alguien en SO me dijo que no hiciera preguntas de hardware allí. Entonces, aquí solo pregunté sobre el problema de hardware. De todos modos, he actualizado mi pregunta para aclarar la razón de hacer esta pregunta.
skm

Respuestas:


1

En orden:

  1. No estoy seguro si realmente tengo solo 2 SM o si algunos de mis SM están deshabilitados

    Tu GPU es GK107. Tiene dos SMX, cada uno con 192 SP. No hay procesadores deshabilitados.

  2. Puede haber [sic] hay alguna forma de habilitar más SM y luego el número de SP por SM disminuirá.

    No hay una forma mágica de cambiar el silicio en el software.

  3. Todavía estoy confundido de que una GPU que tenga más de 2 SM (digamos 8 SM) pero menos cantidad de SP por SM (384/8 = 48 SP por SM) tenga el mismo rendimiento que una GPU que tenga 2 SM y 192 SP por SM.

    Esa es una gran pregunta y una que no voy a tratar de responder aquí. NVIDIA ha publicado una gran cantidad de documentos detallados sobre la arquitectura y el rendimiento de las diversas generaciones de sus tarjetas de cómputo insignia a medida que se lanzan. Si estás tan inclinado, te sugiero que los leas por ti mismo. Dicho esto, la regla general es que dentro de la misma generación de arquitecturacuanto más SM o SMX tenga un dispositivo, mejor funcionará en operaciones aritméticas. Comparar diferentes generaciones de GPU es inútil. Por ejemplo, la primera tarjeta de cómputo Telsa lanzada por NVIDIA tiene 16 SM (la C860). El más reciente tiene 15 SMX (el K40). Hay una diferencia de aproximadamente 10 veces en su rendimiento máximo de precisión simple. Tenga en cuenta también que muchas aplicaciones del mundo real están vinculadas al ancho de banda de memoria, y eso puede cambiar radicalmente la diferencia de rendimiento entre diferentes tarjetas. Mientras que el conteo central y el FLOP máximo han seguido más o menos la Ley de Moore, el ancho de banda de memoria no lo ha hecho.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.