Una alternativa a tener muchos nodos físicos del clúster es crear máquinas virtuales. Solo tendría una o dos máquinas físicas reales, pero podría simular tener muchos más nodos. Esto funcionaría bien para crear, aprender y usar menos recursos (espacio, poder, $$$).
Esto no le daría mucho análisis de costos, pero lo ayudaría a comenzar. El tipo de configuración del clúster dependerá del tipo de trabajo que desee crear para él. Puede tener muchos nodos pequeños o tener solo unos pocos nodos potentes. También hay que tener en cuenta los entornos de memoria compartida y no compartida. ¿Qué tipo de programas paralelos quieres crear? Cuantos más nodos físicos tenga, más espacio, energía, refrigeración e interconectividad de red tendrá que tener en cuenta. A veces, solo una gran computadora masiva es el camino a seguir (y los entornos de memoria compartida son más fáciles de programar para mi humilde opinión).
Recientemente comencé a jugar con un clúster para construir algunas cajas P4 aleatorias, ubuntu y LAM-MPI. Definitivamente ha sido una experiencia de aprendizaje.
En realidad, eran un par de computadoras portátiles y torres p4 que se apilaban juntas en un garaje. Era un gueto, pero solo quería aprender. Acabo de usar una red ethernet de 100 Mbps. Elegí ubuntu, porque no quería lidiar con mucha configuración de hardware de las cajas. Ubuntu tenía muchos de los controladores que necesitaba. Necesitaba un entorno Linux ya que las aplicaciones que escribí para él eran aplicaciones basadas en C con interfaces MPI. Traté de replicar lo que había usado antes. Todo fue misceláneo. hardware, nada estándar. La mayoría de los clústeres tienen hardware exacto para que pueda agregar y eliminar nodos en un instante.