¿Qué es mejor: RAID5 + 1 Hotspare / RAID6? [cerrado]


45

Por curiosidad, tengo 6 x 1TB 7200RPM Near Line SAS para mi nuevo servidor. Puedo configurarlo como RAID5 + 1 Hot Spare o RAID6.

¿Qué debo elegir?


1
Especulo que dentro de 5 años ... mucha gente preguntará ... ¿qué es RAID? Va a salir por la puerta muy pronto pero sigue siendo relevante para hoy.
Matt

1
Entonces, debido a que muchas personas expresan opiniones en lugar de hechos, ¿cerramos el tema y no dejamos que se discutan los hechos? Eso parece mal. Hay cálculos matemáticos que muestran por qué RAID 6 es mejor para la seguridad, la capacidad y cómo se ve afectada la velocidad. No hay opinión involucrada.
Scott Alan Miller

Respuestas:


36

Tienes desventajas y ventajas con cada enfoque; depende de por qué está utilizando RAID. La mayoría de las personas lo usan por disponibilidad. No quieren que una unidad muera y terminen teniendo que apagar su sistema o servidor. En eso, no usas RAID 5. Lo aprendí de la manera más difícil y critico este punto con cada pregunta relacionada con RAID que me planteo en SF.

¿Por qué? Porque a medida que las unidades se hacen más grandes, hay más tolerancia para URE, errores de lectura irrecuperables. Tuvimos que suceder y no es lo que quieres descubrir en medio de una reconstrucción. Escenario: sistema RAID con 3 unidades. Recibimos una alarma en nuestro Dell con una tarjeta PERC de hardware que la unidad C murió. Solicite una unidad nueva, cámbiela, no hay problema. En medio de la reconstrucción, murió.

Según los diagnósticos, hubo un "punto malo" en la unidad B. El sistema tuvo un error silencioso en esa unidad repetidamente, y ahora que estaba reconstruyendo los datos, no podía leer ese punto, y no importa cuántas veces ejecutamos la reparación incluso desde el controlador directamente y cada vez decía que todo estaba arreglado, no se reconstruiría. Entonces tenemos una unidad muerta y una unidad que no podía leer desde un lugar ... terminamos reemplazando 2 unidades y restaurando desde la copia de seguridad.

Lección: RAID no es una copia de seguridad, y RAID 5 ya no es una opción de disponibilidad para unidades más grandes.

Si está buscando aumentar la velocidad o aumentar el tamaño de almacenamiento, puede equilibrar eso en su decisión. Debe definir sus necesidades en términos de sus necesidades y objetivos, no en términos de "Necesito RAID, ¿qué uso?"


1
Las unidades destinadas a operaciones RAID generalmente fallan su corrección de errores muy rápidamente e informan la falla al controlador. La idea es evitar situaciones como las descritas anteriormente: el bloque defectuoso se reasigna y los datos se recuperan de la paridad en lugar de que el disco se marque como defectuoso porque se "cuelga" durante 45 segundos al intentar recuperar ese bloque. Western digital incluso tiene una utilidad para cambiar el comportamiento de recuperación de errores de sus discos, aunque la utilidad no se publica "oficialmente".
Chris

77
No pude seguir el argumento. ¿Estás diciendo usar RAID 6 o RAID 5?
Martin

@martin: Estoy comentando la preocupación de que ciertos tipos de fallas de disco se tratan de manera diferente dependiendo del diseño de destino del disco en sí. Martin describió una falla de varios discos como resultado de un "punto malo" en un disco, que en algunas situaciones no (y no debería) causar una reconstrucción completa de la matriz. En el proceso de reconstrucción de la matriz, otro disco falló, lo que resultó en un mal día.
Chris

@chris - Perdón por la confusión - No estaba comentando tu comentario. (No estaba allí cuando publiqué). Mi pregunta estaba dirigida a Bart: no podía entender si estaba diciendo que RAID 5 es imprescindible, o si RAID-5 no es suficiente y solo RAID 6 lo haría.
Martin

2
@ Chris: ya no sé cuál sería la diferencia, pero los PERC están basados ​​en hardware, caché integrada, herramientas de administración integradas, intercambio en caliente, etc., y aunque Dell no necesariamente cobra diez mil dólares por los servidores, son bastante popular en el entorno empresarial. Se supone que las unidades informan errores; así es como obtienes mensajes de error y alertas. Pero los URE son algo que sucede con las unidades y no parecen darse cuenta hasta que hacen algo como ... oh ... reconstruir una matriz. Entonces, de repente "¡Oye! ¡También hay un problema aquí!"
Bart Silverstrim

16

Use RAID6. Lea "Por qué RAID 6 deja de funcionar en 2019" por Robin Harris en ZDNet.


44
¿Y qué pasa después de 2019?
Mat

2
@ Mat Hola del año en que RAID 6 deja de funcionar. ;-) Esto realmente debería haber estado en el artículo, pero tendrá que analizar la codificación de borrado , implementada típicamente con sobremuestreo polinómico sobre GF (256) . Esto significa que se pueden usar (casi) niveles de redundancia arbitrarios, por ejemplo, 9 + 3 o 12 + 4. La principal desventaja es que es bastante más costoso desde el punto de vista computacional que las paridades RAID 6 o incluso RAID 5.
Arne Vogel

9

RAID 5 nunca debería existir con un repuesto dinámico (repuesto dinámico). RAID 6 siempre es un mejor uso del mismo número de unidades.

http://www.smbitjournal.com/2012/07/hot-spare-or-a-hot-mess/

La solución RAID 5 no tiene una ventaja de espacio / capacidad o una ventaja de costos (pero sí una pequeña ventaja de rendimiento), pero es muy útil para mitigar cosas como el riesgo de URE.


3
RAID-6 es sustancialmente más lento que RAID-5 + un repuesto dinámico. RAID-6 no siempre es mejor.
Stefan Lasiewski

2
RAID-5 (o para el caso RAID-6) con un repuesto puede tener mucho sentido desde la perspectiva del recuento de unidades si tiene más de una franja que puede compartir un solo repuesto. Eso permite que la recuperación comience inmediatamente cuando falla una unidad, y reemplazar la unidad fallida lo antes posible, pero cuando sea conveniente , en lugar de luchar para reemplazar la unidad fallida antes de que haya otra falla.
un CVn

2
RAID 6 es más rápido en lecturas, más lento en escrituras. Pero solo cuando es aleatorio. Secuencial, es más rápido en ambos. Pero la diferencia de seguridad es épica, un orden completo de diferencia de magnitud. Agregue un caché de escritura como cualquier hardware de clase empresarial que RAID tenga y las escrituras aleatorias de RAID 6 se reducen drásticamente. Es muy raro que R6 sea más lento que R5 ya que tiene el eje adicional.
Scott Alan Miller

La recuperación inmediata es en realidad el peligro porque es la operación de recuperación que pone a la matriz en el mayor peligro. R6 con repuesto dinámico es totalmente diferente a R5 con repuesto dinámico. R5 con un repuesto dinámico nunca debería existir porque usa esa misma unidad en R6 pero gana velocidad y confiabilidad. No hay necesidad de recuperación, la protección ya está en su lugar sin el riesgo de URE de la operación de recuperación.
Scott Alan Miller

6

Esto es fácil: ¿desea más espacio en disco disponible o la capacidad de sobrevivir a los discos que fallan? Es así de simple.

Así que haré algunas suposiciones descabelladas: que no te importa el rendimiento ya que son 7.2 y que te importa el espacio disponible ya que son discos de 1TB, no mencionas qué tipo de datos quieres para almacenar, pero voy a suponer que son archivos de video o una combinación de video y audio. Si estoy en lo cierto, entonces, ¿presumiblemente tendrías dificultades para reemplazar los datos? en ese caso no elegiría ni 5 ni 6 pero iría con R10, sí, pierdes 1TB sobre R6 y 2TB sobre R5, pero será más rápido y podrá sobrevivir a tres discos que saltan. Si me equivoco y puede recuperar rápidamente sus datos, entonces también puede ir a R5 para obtener el mayor espacio disponible.


1
"Sí, pierdes 1TB sobre R6 y 2TB sobre R5, pero será más rápido y podrá sobrevivir a tres discos que salgan". Eso es si tienes suerte; en el peor de los casos, no sobrevivirá más de 1 falla de la unidad (si el segundo está en el mismo par RAID 1 que el primero). Si no me equivoco, para 1, 2, 3 y 4 fallas de la unidad, la probabilidad acumulativa 'ingenua' de tener que recurrir a la copia de seguridad es 0, 1/5, 3/5, 1, respectivamente (el número de cero los términos son el número de fallas del disco que pueden tolerarse de manera segura). Con RAID 6, es 0, 0, 1, que es algo más fácil de trabajar, además de que no pierde ese terabyte adicional.
James Haigh

2
Tienes razón James, las cosas han cambiado en los últimos CINCO AÑOS (OMG que fue hace mucho tiempo, ¡guau!) Y ahora solo recomiendo R6 / 60 y R1 / 10.
Chopper3

4

Si bien el rendimiento es una preocupación, no es tan preocupante como cree. El hardware RAID más nuevo será tan rápido escribiendo 2 bandas de paridad como lo son en 1 banda.

Además, las unidades SAS generalmente tienen una tasa de error de bit más baja, lo que se traduce en un error de lectura irrecuperable (URE) más bajo. Por lo general, un orden de magnitud (10x), sin embargo, si la unidad SAS es del mismo modelo que una unidad SATA, es posible que no vea una mejora.

Finalmente, en cuanto a la cuestión de RAID-5 y URE y cómo eso puede arruinar tu día, escribí un artículo sobre esto hace algún tiempo en: http://subnetmask255x4.wordpress.com/2008/10/28/sata- irrecuperable-errores-y-cómo-que-impacta-incursión / en el que cubro algunas de estas preguntas. Básicamente, RAID-6 en buen hardware (no RAID de software) debe mostrar un rendimiento equivalente a RAID-5. Si tiene un hardware deficiente o está utilizando RAID de software, verá un impacto en el rendimiento.

Como siempre, las copias de seguridad son su gracia salvadora. No olvide implementar una política de respaldo, Y verifique que se pueda recuperar.


2
Wow, creo que estaba en todo el lugar con ese. Lo que estaba tratando de decir es que, dadas sus unidades, si tiene un buen controlador RAID de hardware, RAID 6 no tiene inconvenientes sobre RAID 5 con un repuesto dinámico (el +1). Sin embargo, si no tiene un buen controlador RAID de hardware, verá lecturas y escrituras más lentas, con escrituras un poco más lentas que las lecturas. Si solo usa RAID de software, verá una lectura más lenta y escrituras mucho más lentas. Buen hardware - RAID 6; Hardware deficiente: RAID 6 con éxito en el rendimiento; Solo software: RAID 5 (+1) y reza mucho.

3

Muchos buenos consejos aquí, particularmente de Bart y Chopper3.

Lo único que agregaría es probar su carga de trabajo bajo una condición de falla. La gente generalmente configura un RAID-5 / RAID-6 para comprar disponibilidad (es decir, el servidor no se cae debido a una falla del disco). Desafortunadamente, para algunas cargas de trabajo, especialmente las cargas de trabajo de escritura pesada, puede encontrar que el impacto en el rendimiento es lo suficientemente severo como para no comprar mucho.

Si las pruebas funcionan, excelente, simplemente no olvides diseñar y probar una estrategia de respaldo.


2

Creo que RAID 5 vs. 6 (y vs. 10) se reduce al rendimiento y a cuánto confía en la (s) marca (s) de unidades que usa. Utilizamos principalmente servidores HP y almacenamiento HP y hemos tenido muy pocas fallas de disco, por lo que estoy contento con RAID5 + hotspare o incluso RAID5 en sistemas menos críticos.

En teoría, RAID6 lo salva de una segunda falla de la unidad mientras se reconstruye una primera unidad fallida, pero lo intercambia con el aumento de los cálculos necesarios para generar 2 franjas de paridad diferentes. No hemos usado 6, por lo que nunca he visto ninguna especificación sobre qué tan rápido se puede reconstruir una matriz RAID6 frente a RAID5, pero supongo que 6 tomará más tiempo ya que tiene que hacer 2 cálculos de paridad, no solo uno.

Si me fuera a alejar de RAID5, probablemente iría con 10 (o 01) para alejarme por completo de los cálculos de paridad. Con 6 unidades, puede hacer eso, aunque solo obtiene la mitad de la capacidad.


2

RAID 6. De esa manera, si dos discos fallan en una sucesión relativamente rápida, por lo que la matriz no ha terminado de reconstruirse desde la primera falla (o 2 discos fallan al girar después de un corte de energía), no ha perdido todos sus datos.


1

Raid6 tiene más gastos generales, por lo que raid5 como tal será más rápido en la misma cantidad de unidades. Por otro lado, puede perder la ventaja una vez que un disco muere, y el rai5 se reconstruye, corre el riesgo de perder la matriz si otras unidades mueren durante la reconstrucción.

En su caso, está ejecutando raid5 vs 6 en una cantidad diferente de husos, por lo que debido a la incursión adicional del husillo6 podría ser más rápido.


1

Buenas respuestas, excepto que nadie ha mencionado el rendimiento de escritura. RAID 6 generalmente le da un ligero rendimiento en la escritura en comparación con RAID 5, ya que se deben mantener dos franjas de paridad.

Sin embargo, la mayoría considera que vale la pena ir con RAID 6.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.