HDD todavía es bastante preferido, pero ¿por qué?
Eso depende de con quién hable, sus antecedentes (administración, TI, ventas, etc.) y a qué tipo de servidor se refiere la discusión. Los discos duros son generalmente un orden de magnitud menos costoso por byte, pero usan más energía y casi siempre son más lentos, dependen de la carga de trabajo.
Casi siempre se reduce el costo y la cantidad de almacenamiento que se puede adaptar a una cantidad determinada de servidores. Si puede obtener el rendimiento de una matriz RAID de 5 discos con un solo SSD, el SSD probablemente sea mucho menos costoso y use una fracción de la potencia, pero también obtendrá quizás 1/10 del almacenamiento.
¿Qué es mejor para el almacenamiento activo?
Aquí es donde se complica, y por qué muchas personas se saltearán la complicación y simplemente irán con los discos duros que conocen.
Los SSD vienen en diferentes grados con límites en la cantidad de datos que se pueden escribir en las celdas, que NO es lo mismo que la cantidad de datos escritos por el host. Escribir pequeñas cantidades de datos termina escribiendo grandes cantidades en las células, esto se llama amplificación de escritura y puede matar rápidamente unidades con clasificaciones de baja resistencia.
Las celdas SSD se nombran por la cantidad de bits que pueden almacenar, para almacenar n bits, necesitan 2 ^ n niveles de voltaje por celda. Un TLC (bit triple) necesita 8 niveles de voltaje para direccionar esos bits. En general, cada vez que aumenta el nivel de bits por celda, obtiene una caída de 3-10X en la durabilidad de la celda. Por ejemplo , una unidad SLC puede escribir todas las celdas 100000 veces antes de que las celdas mueran, Enterprise eMLC 30000 veces, MLC 10000, TLC 5000, QLC 1000.
También hay mejoras generacionales en la tecnología de celdas SSD, una mejor litografía y 3D NAND mejoran la densidad y el rendimiento en comparación con 2D NAND más antiguo, "El MLC de hoy es mejor que el SLC de ayer", según lo citado por el analista Jim Handy .
Los SSD en realidad no escriben directamente en las celdas direccionadas, escriben en bloques de celdas. De esta forma, el bloque tiene una cantidad más consistente de escrituras de celda, y cuando las celdas salen de la tolerancia, todo el bloque se marca como incorrecto y los datos se mueven a un nuevo bloque. La resistencia SSD se basa en el tipo de celda, cuántos bloques de repuesto están disponibles, cuánta sobrecarga para la corrección de errores y cómo la unidad utiliza el almacenamiento en caché y los algoritmos para reducir la amplificación de escritura. La tolerancia que el fabricante selecciona para marcar mal también entra en juego, una unidad empresarial marcará bloques defectuosos antes que una unidad de consumo, a pesar de que cualquiera de ellos sigue siendo completamente funcional.
Los SSD de "alta escritura" de grado empresarial se basan en celdas SLC o eMLC y tienen grandes cantidades de bloques de repuesto, y generalmente tienen un gran caché con condensadores para asegurarse de que el caché pueda descargarse en el disco cuando se pierde la energía.
También hay unidades con una resistencia mucho menor para aplicaciones de "alta lectura" como servidores de archivos que necesitan tiempos de acceso rápidos, cuestan menos por byte al precio de resistencia reducida, con diferentes tipos de células, menos área de reserva, etc. puede tener solo el 5% de la resistencia de una unidad de "alta escritura", pero tampoco la necesitan cuando se usa correctamente.
Por ejemplo, para la base de datos, ¿dónde está activo el disco todo el tiempo?
Mi base de datos es pequeña, con lecturas intermitentes que representan el 95% del acceso, y la mayor parte está en caché en RAM, es casi tan rápido en un HDD como en SSD. Si fuera más grande, no habría suficiente RAM en el sistema, y el SSD comienza a marcar una gran diferencia en los tiempos de acceso.
Las unidades SSD también hacen que las copias de seguridad y los pedidos de magnitud de recuperación sean más rápidos. Mi base de datos restaurada de la copia de seguridad en aproximadamente 10 minutos a una SSD lenta, o aproximadamente 11 segundos a una realmente rápida, la copia de seguridad en una HDD hubiera sido de aproximadamente 25 minutos. Eso es al menos 2 órdenes de magnitud, y eso puede hacer una gran diferencia dependiendo de la carga de trabajo. Literalmente puede pagarse el día 1.
Las bases de datos con grandes cantidades de pequeñas escrituras pueden asesinar una unidad TLC de grado de consumidor en cuestión de horas.
¿Y el SSD es realmente útil para el servidor?
Absolutamente, si se selecciona el tipo de unidad y el grado correctos para la aplicación, si lo hace mal, puede ser un desastre.
Mi servidor ejecuta varias bases de datos, más almacenamiento en red de alta lectura, más almacenamiento de metraje de seguridad de alta escritura, más almacenamiento mixto de lectura y escritura de archivos y copia de seguridad del cliente. El servidor tiene un conjunto de discos duros RAID-6 para el almacenamiento en red masivo y NVR, un único SSD MLC de alto rendimiento para MySQL y 3 unidades TLC de consumo en RAID-5 para copias de seguridad de clientes y bases de datos y almacenamiento de red de acceso rápido.
La velocidad de escritura en el SSD RAID es aproximadamente la misma que la del HDD RAID, pero la velocidad de lectura de acceso aleatorio es más de 10 veces más rápida en el SSD RAID. Una vez más, este es un SSD TLC para el consumidor, pero dado que la velocidad de escritura secuencial es aproximadamente 3 veces más rápida que la LAN de gigabits, nunca se sobrecarga, y hay mucha sobrecarga si el sistema realiza copias de seguridad locales cuando se accede de forma remota.
La mayoría de los SSD también ofrecen borrado seguro instantáneo (ISE) , que puede borrar los datos en unos segundos, en comparación con muchas horas o días para los HDD que no tienen esa característica, solo unos pocos HDD de grado empresarial tienden a ofrecer ISE, pero se están convirtiendo más común. Esto es muy útil si está retirando o volviendo a utilizar un disco.
¿Cuál es la mejor solución (sistema de archivos) para escribir?
Depende del tipo de datos y los tipos de características del sistema de archivos que desee. Solo estoy usando EXT4 y BTRFS (necesito instantáneas y sumas de verificación). La sobrecarga del sistema de archivos disminuirá el espacio utilizable y puede reducir ligeramente la vida útil de los SSD, BTRFS tiene una sobrecarga alta para las sumas de verificación y otras características, y las instantáneas utilizarán mucho espacio.
En caso de falla mecánica, no hay forma de repararlo (¿es correcto?)
Independientemente del tipo de unidad, ¿alguna vez ha tenido que realizar la recuperación de datos en una unidad muerta? Puede ser muy costoso , es mejor tener una copia de seguridad escalonada, RAID en el almacenamiento principal, copias de seguridad versionadas localmente en un dispositivo o máquina diferente, y luego sincronizarlas fuera del sitio o en la nube. 1 TB de almacenamiento en la nube es de $ 5 por mes, la recuperación de datos en un HDD puede costar 2 mil dólares, y un SSD muerto puede ser imposible de recuperar ... solo haga las copias de seguridad y olvide la reparación.