[Supongo que te sientes cómodo con el impacto en el rendimiento de RAID6 y solo te preocupan las fallas]
Estoy usando los números de http://en.wikipedia.org/wiki/Standard_RAID_levels , y soy un asco en matemáticas, por lo que esto puede estar mal. Supongamos que el 5% de sus unidades morirán dentro de 1 año.
La probabilidad de que un miembro de la doble-RAID 1 pura y simple de morir es la probabilidad de cualquier unidad dada de morir, al cuadrado: P(R1) = P(drive)^2
.
Entonces, con la tasa de falla del 5%, terminas con:
P(R1) = 0.005^2 = 0.0025 = 0.25%
(Aquí es donde no estoy seguro sobre las matemáticas --- tiene sentido, pero eso no significa nada)
Por lo tanto, las posibilidades de perder a cualquier miembro de R1 son de 0.25% por año, pero tiene varios de ellos unidos, y si alguno de ellos muere, su matriz está muerta. por lo que necesita para tapar el número P (R1) en el fallo de matemáticas R0: P(R10) = 1 - (1 - P(R1))^(n_R1)
. Supongamos que tiene 8 unidades en total (y no las reemplace cuando fallan), por lo que una franja en 4 R1:
P(R10) = 1 - (1 - 0.0025)^4 ~= 0.99%
Por lo tanto, tiene aproximadamente un 1% de posibilidades de perder un RAID10 que tiene 8 unidades con un 5% de posibilidades de falla por año.
Simplísticamente, la probabilidad de que RAID6 falle es la probabilidad de que una unidad determinada muera en cubos (ya que tiene que perder tres unidades para que falle), por ejemplo:
P(drive)^3 = (5%)^3 = 0.0125%
Entonces, para el escenario de "múltiples unidades muriendo", RAID6 tiene aproximadamente 1/80 de probabilidad de fallar como RAID10 con las mismas unidades.
Desafortunadamente, la vida es complicada y hay que lidiar con sectores que van mal. Es muy probable que se introduzcan errores aleatorios en sus unidades que pasan desapercibidos. Ya no solo estoy copiando wikipedia aquí, pero supongo que es probable que aparezca un sector defectuoso en cualquier unidad P(bs) = P(UBER) * bits_written
. Si eso sucede, la recuperación después de una falla de la unidad es imposible en un R1 y más complicada en un R6.
Por supuesto, todo eso es discutible si el controlador o controlador RAID6 tiene errores, e introduce errores en sus datos, o corrompe su matriz :-)