En primer lugar, la disponibilidad total o el tiempo de actividad de un clúster depende de qué tan grande se necesita una parte del clúster para estar activo para que todo el clúster se considere "activo".
- ¿Es suficiente una máquina que funcione? Eso significaría que cualquier máquina puede tomar la carga completa si es necesario.
- ¿Todos ellos deben estar activos al mismo tiempo? Es decir, no hay redundancia.
- ¿O tal vez dos de cada tres en línea son suficientes? Esto permitiría una carga de trabajo mayor que el primer caso.
Como descubrió, los dos primeros casos son bastante simples de calcular. Supongamos que la probabilidad de que un solo servidor esté en línea en cualquier momento dado p = 0,95. Ahora, para tres servidores, la probabilidad de que estén todos en línea al mismo tiempo es p 3 = 0.857375.
Para el caso opuesto, donde al menos una máquina debe estar activa en un momento dado, es más fácil de calcular invirtiendo el problema y observando las probabilidades de que las máquinas estén fuera de línea . La probabilidad de que una sola máquina esté fuera de línea es q = 1- p = 0.05 y, por lo tanto, la probabilidad de que todas estén inactivas al mismo tiempo es q 3 = 0.000125, lo que da una probabilidad 1- q 3 = 1- (1- p ) 3 = 0.999875 que al menos uno está arriba.
El caso 2 de 3 es un poco más difícil de calcular. Hay cuatro situaciones posibles en las que al menos dos de cada tres servidores están activos. 1) ABC está arriba, 2) AB está arriba, 3) AC está arriba, 4) BC está arriba. Las probabilidades para todos estos son, respectivamente, ppp , ppq , pqp y qpp . Como los casos son disjuntos, las probabilidades se pueden sumar, dando un total de A = p 3 + 3 p 2 q = 0.992750.
(Esto se puede ampliar a más máquinas. Los factores son los coeficientes binomiales bien conocidos , por lo que contar los diferentes casos a mano funciona principalmente como un ejercicio).
Por supuesto, cálculos como este son mucho más fáciles de manejar mediante el uso de un programa de computadora listo para usar ... Al menos una calculadora en línea se puede encontrar aquí:
http://stattrek.com/online-calculator/binomial.aspx
Al ingresar los valores de entrada: probabilidad de éxito = 0.95, número de intentos = 3, número de éxitos = 2, obtenemos el resultado "Probabilidad acumulativa: P (X ≥ 2) = 0.99275". También se dan algunos otros valores relacionados, y la herramienta en línea también facilita jugar con otros números.
Y sí, todo lo anterior supone que los servidores fallan de forma independiente, es decir: a) ignoré cualquier problema que afecte al clúster en su conjunto, b) no hay nada como el envejecimiento de los componentes que podría hacer que los servidores fallen. o casi al mismo tiempo.