Tendremos una máquina en el trabajo que, con el máximo rendimiento, debería ser capaz de empujar 50 ("cabezales de escritura") x 75 GB de datos por hora. Ese es el rendimiento máximo de ~ 1100 MB / s de velocidad de escritura. Para obtener eso de la máquina, se requieren dos líneas de 10GBi. Mi pregunta es qué tipo de servidor + tecnología puede manejar / almacenar dicho flujo de datos.
Actualmente para el almacenamiento de datos trabajamos con ZFS, aunque las velocidades de escritura nunca fueron una pregunta. (ni siquiera estamos cerca de estas velocidades) ¿Sería una opción ZFS (zfs en linux)? También necesitamos almacenar muchos datos, la "guía de TI" sugiere entre 50 y 75 TB en total. Por lo tanto, probablemente no puedan ser todos los SSD a menos que queramos ofrecerle a nuestro primogénito.
Algunas adiciones basadas en las excelentes respuestas:
- el máximo es de 50x75 GB / hora durante el pico, que es inferior a 24 h (muy probablemente <6 h)
- No esperamos que esto suceda pronto, lo más probable es que corramos 5-10x75GB / hora
- es una máquina pre-alfa, sin embargo, se deben cumplir los requisitos (aunque hay muchos signos de interrogación en juego)
- usaríamos NFS como la conexión de la máquina al servidor
- diseño: máquina generadora -> almacenamiento (este) -> (incursión segura 6) -> clúster de cómputo
- así que la velocidad de lectura no es esencial , pero sería bueno usarla desde el clúster de cómputo (pero esto es completamente opcional)
- lo más probable es que sean archivos de datos grandes (no muchos pequeños)