He ejecutar el código de dinámica molecular (MD) GROMACS en un clúster Linux Ubuntu que consta de nodos que contienen 24 CPUs Intel Xeon. Mi punto de interés particular resulta ser algo sensible a la precisión aritmética de coma flotante, por lo que he tenido que ejecutar GROMACS con doble precisión en lugar de una sola precisión, a pesar del mayor costo computacional de la doble precisión. Entonces, en el clúster, he compilado GROMACS en doble precisión.
Estoy considerando la compra de algunas GPU, ya que puede haber una relación de aceleración ( "aceleración de la GPU") a las CPU. Sin embargo, necesito una GPU que me permita hacer aritmética de doble precisión. ¿Sabe si dicho hardware está disponible comercialmente? Una publicación reciente en la lista de correo GROMACS sugiere que las GPU de doble precisión no están disponibles comercialmente:
El hardware no lo admite [aritmética de doble precisión] todavía AFAIK.
Esta página de Wikipedia parece sugerir que las GPU de doble precisión son poco comunes ya que pueden ser ineficientes:
Las implementaciones de punto flotante en las GPU Nvidia son en su mayoría compatibles con IEEE; Sin embargo, esto no es cierto en todos los proveedores. Esto tiene implicaciones para la corrección que se consideran importantes para algunas aplicaciones científicas. Si bien los valores de coma flotante de 64 bits (flotante de doble precisión) están comúnmente disponibles en las CPU, estos no son compatibles universalmente en las GPU; algunas arquitecturas GPU sacrifican IEEE cumplimiento mientras que otros carecen por completo de doble precisión. Se han hecho esfuerzos para emular de doble precisión los valores de punto flotante en la GPU; sin embargo, la compensación de velocidad niega cualquier beneficio de descargar el cálculo en la GPU en primer lugar.
Esta página de NVIDIA Tesla , al hacer referencia al "rendimiento de punto flotante de precisión doble de pico" en el gráfico, parece sugerir que los cálculos de precisión doble pueden , de hecho, hacerse en sus GPU (aunque a un costo computacional más alto).
Entonces, ¿qué debo creer? ¿Tienes alguna experiencia con este problema?