Con Debian 9 "stretch" con una GPU anterior (GT 720) se necesitan pasos adicionales. Veo que alguien de arriba (@celavek) tenía esto, así que completaré lo que funcionó para mí. La respuesta aceptada cubre casi todo lo necesario. Reconocer que este es un buen ejemplo de nicho, pero espero que haya algunas cosas útiles aquí que ahorren a las personas algunas búsquedas en Google.
Para CUDA 8.0 en el paso 1, haga clic en "Versiones heredadas" y seleccione "CUDA Toolkit 8.0 GA 2". Luego Linux, x86_64, Ubuntu, 16.04, runfile (local).
No acepté el controlador empaquetado y en su lugar utilicé mis controladores 384.130 previamente instalados para mi GPU. Más información sobre eso aquí: Debian Wiki . Su millaje puede variar, no puedo hablar por otras tarjetas que no sean una GT 720. Este fue el camino que elegí, no me arrepiento (todavía).
Cuando la instalación falla debido a una incapacidad para InstallUtils.pm local en el paso 12, deberá descomprimir el archivo cuda_8.0.61_375.26_linux.run pero ejecutarlo con el indicador --tar mxvf. Luego (como root) copie InstallUtils.pm a / usr / lib / x86_64-linux-gnu / pearl-base:
./cuda_8.0.61_375.26_linux.run --tar mxvf
sudo cp InstallUtils.pm /usr/lib/x86_64-linux-gnu/perl-base
Ahora el comando del paso 12 debería tener éxito.
Su Debian 9.0 viene con g ++ versión 6+, esto no funcionará. La compilación de vectorAdd en el paso 15 fallará. Seguí este documento técnico: Instalación de varias versiones de GCC para instalar la versión 5.5.0. Para 5.5.0 querrás este archivo
wget http://mirrors.concertpass.com/gcc/releases/gcc-5.5.0/gcc-5.5.0.tar.xz
y desempaquete el tarball con esto:
tar -xJf gcc-5.5.0.tar.xz
Necesitaba actualizar algunas cosas (bibliotecas y agregar compilación de 32 bits) para que esto funcione para mí:
sudo apt-get install libgmp3-dev libmpfr-dev libmpc-dev
sudo dpkg --add-architecture i386
sudo apt-get update
sudo apt-get install build-essential gcc-multilib rpm libstdc++6:i386 libgcc1:i386 zlib1g:i386 libncurses5:i386
Ahora puede configurar, crear e instalar el compilador.
Recuerde configurar con los --prefix = / usr / local / gcc / 5.5.0 bandera
Ahora puede compilar el ejemplo de vectorAdd en el paso 15 con esto:
make HOST_COMPILER=/usr/local/gcc/5.5.0/bin/g++
O esto:
export HOST_COMPILER=/usr/local/gcc/5.5.0/bin/g++
make
No es necesario modificar el Makefile, maneja la anulación del compilador correctamente.
Ahora debería tener una instalación CUDA 8.0 en funcionamiento en estiramiento.