Un trabajo típico en Blue Waters es usar aproximadamente el 10% de la máquina y consume un total de 75 horas de nodo . Blue Waters tiene alrededor de 27500 nodos, lo que significa que algunos de esos trabajos de "75 horas de nodo" se ejecutan en solo un par de minutos. Eso permite a los científicos usar la máquina de forma algo interactiva. (Puede ver los promedios móviles aquí: http://xdmod.ncsa.illinois.edu/#tg_usage:group_by_Jobs_none )
Las supercomputadoras son solo grandes colecciones de computadoras más pequeñas. La razón principal por la que los reunimos en un solo lugar es que podemos compartir el costo de la manera más eficiente. Está tratando de crear una computadora que pueda hacer mucho trabajo y para la cual el costo total de propiedad (el costo total de la computadora, la energía y el mantenimiento) se minimice durante la vida útil de la computadora.
Hay varios factores involucrados en el costo total de propiedad: El costo del equipo es uno. Para minimizar el costo de propiedad, desea que el equipo realice un trabajo útil el mayor tiempo posible (idealmente el 100% del tiempo, de manera realista algo menos, como el 95% se consideraría bueno), hasta que el equipo se queme. o se vuelve obsoleto. Por el contrario, la computadora en su computadora portátil o su teléfono probablemente esté en uso menos del 10% del tiempo que lo posee (está dormido el 33% del tiempo, está comiendo y relajándose aproximadamente la mitad del tiempo que está despierto, y incluso cuando está "usando" la computadora, el procesador está inactivo la mayor parte del tiempo).
El segundo es el costo del poder. Hay varias partes de esto: la primera es el costo del poder en sí. Parte de ese costo se consume al transportar la energía desde la planta de energía a la computadora. Parte de ella se pierde en la "fuente de alimentación" de la computadora (que simplemente convierte la alimentación de CA en alimentación de CC). Un convertidor AC-> DC más grande generalmente se puede hacer más eficiente. Además, las computadoras convierten la energía eléctrica útil en calor residual. Por lo tanto, también debe pagar para eliminar el calor. Una vez más, los acondicionadores de aire más grandes generalmente se pueden hacer más eficientes que múltiples acondicionadores de aire pequeños.
El tercero es el costo de mantenimiento. Al juntar un montón de computadoras y diseñarlas para que, cuando una se caiga, el resto siga funcionando, puede amortizar el costo del personal de mantenimiento en una cantidad mucho mayor de nodos de computadora que si los nodos fueran todos diferentes y se ubicaran en diferentes edificios. (o ciudades).
Los detalles: Blue Waters tiene 288 gabinetes. Cada gabinete tiene 96 "nodos". Cada nodo es una computadora de gama alta bastante normal. La mayoría de los nodos tienen 2 procesadores AMD Opeteron 6276 que funcionan a 2.3GHz y 64GByte de DRAM. Aproximadamente 1/6 de los nodos tienen un solo AMD Opteron 6276, una GPU NVidia K20 y 38 GByte de DRAM. Si lo desea, puede comprar algo similar a un "nodo" por alrededor de $ 3000 o $ 4000 y ponerlo en su sala de estar para jugar videojuegos. Blue Waters tiene alrededor de 27648 nodos. https://bluewaters.ncsa.illinois.edu/hardware-summary
Cada nodo probablemente consume un poco más de 500 vatios y convierte esa energía en calor. Si tuviera un nodo en su sala de estar para jugar videojuegos, no sería un gran problema. Consumiría algo de electricidad de la toma de corriente y generaría casi tanto calor como un pequeño calentador de espacio personal. En el invierno sería agradable y acogedor. En el verano tendrías que usar tu aire acondicionado con más frecuencia para mantener tu casa cómoda. Si lo hiciera funcionar a toda potencia todo el día todos los días, su factura de electricidad aumentaría considerablemente, quizás el doble de lo que está consumiendo ahora.
Pero cuando juntas 27648 de ellas, consume aproximadamente 15 megavatios y genera una cantidad correspondientemente grande de calor. La verdadera maravilla de la ingeniería de Blue Waters, como cualquier gran centro de datos, es el edificio en sí. Es una enorme caja refrigerada. El edificio Blue Waters es particularmente interesante porque es increíblemente eficiente. Aproximadamente el 85% de la energía que entra al edificio se usa realmente para ejecutar los nodos. Creo que leí en alguna parte (no puedo encontrarlo en este momento) solo el 15% se pierde en la conversión de energía y eliminando el calor residual. Eso es mucho mejor de lo que obtendría de la computadora de juegos de 500 vatios en su sala de estar. Probablemente necesitará una "fuente de alimentación" de 750 vatios y otros doscientos vatios para hacer funcionar el aire acondicionado.
TL; DR
Pongámoslo todo junto. Al reunir miles de computadoras más pequeñas y difundir el uso entre muchas personas, mantenemos esas computadoras funcionando la mayor parte del tiempo, compartiendo los recursos de una manera muy eficiente. Cuesta mucho dinero dar a las personas computadoras que permanecen inactivas la mayor parte del tiempo. La mejor manera de ahorrar dinero en computación es hacer que las personas compartan las computadoras para que las computadoras estén ocupadas la mayor parte del tiempo.
Blue Waters es mucho más que las computadoras que contiene. Está especialmente diseñado para ser tan eficiente como sea posible. Parte de eso implica colocarlo cerca de plantas de energía para reducir las pérdidas de energía en las líneas de transmisión de energía. Aquí hay una imagen satelital de la parte de Champaign IL que contiene Blue Waters para demostrar: