Hay algunas diferencias, sin embargo, no son necesariamente en hardware o especificaciones. Tenga en cuenta que esta es toda la información que obtuve de foros o comunicados de prensa, así que tómelo con un poco de sal.
El primero es la "escalabilidad y fiabilidad" ( fuente ). El K20 fue diseñado para instalarse en un sistema de clúster y funcionar a toda velocidad 24/7. El Titan está más diseñado para juegos, por lo que funcionará en este ciclo de trabajo, pero puede sufrir problemas de por vida a largo plazo si se usa de esta manera.
Los controladores también son diferentes, sin embargo, no estoy seguro de las principales diferencias. La diferencia en el enfoque del diseño de las tarjetas probablemente conduce a ganancias de rendimiento relativamente pequeñas para las tarjetas Tesla en este frente.
"Algunas características exclusivas de Tesla incluyen:
- NVIDIA GPUDirect RDMA para rendimiento InfiniBand
- Hyper-Q para MPI (Hyper-Q para CUDA Streams es compatible con GeForce GTX TITAN)
- Protección ECC para todos los registros y memorias internas y externas.
- Herramientas compatibles para la GPU y la gestión de clusters, como brillante Computing, ganglios."( Fuente )
Esto apunta al hecho de que la diferencia principal es su escalabilidad. Si está buscando ejecutar en una computadora de escritorio en su oficina, sería difícil argumentar en contra de un Titán sobre el K20 por la diferencia de precio. Si necesita el rendimiento adicional de múltiples K20, encuentre un centro HPC y gane tiempo con sus servidores.
Editar:
Después de analizar un poco más el ECC, estoy actualizando esta respuesta para señalar las implicaciones de tenerlo en el K20 y no en el Titán. La siguiente información es una paráfrasis de la información que se encuentra aquí .
ECC es una comprobación de errores en la DRAM y registros para la GPU. Los errores suaves son cuando un bit se transfiere / almacena incorrectamente. Cuanto más rápido y más cerca estén los circuitos, mayor será la probabilidad de un error suave. Si está resolviendo un conjunto de EDO acopladas o resolviendo un sistema lineal, un solo número desactivado por un bit podría cambiar significativamente los resultados de una manera no reproducible. La mayoría de las memorias RAM y cachés estándar en la CPU se verifican por error para estos errores utilizando ECC.
Por otro lado, las GPU no tienen ECC en general, aunque su bus de memoria es mucho más rápido que el de la CPU. Esto se debe a que si un píxel en la pantalla está apagado un poco por un cuadro, la calidad del programa no disminuye. Estos errores tampoco se propagan. Por lo tanto, se puede ahorrar una gran cantidad de bienes inmuebles (y costos) al omitir esta función. Esta complejidad adicional probablemente causa una gran parte del costo adicional de la línea Tesla.