Esta respuesta ha sido editada después de que la pregunta fue aclarada.
¿Cuáles son otros motivos por los que las nubes prefieren DAS?
Donde "DAS" significa almacenamiento de conexión directa, es decir, unidades de disco duro SATA o SAS.
Todos los proveedores de la nube usan DAS porque ofrece mejoras de orden de magnitud en precio / rendimiento. Es un caso de escala horizontal .
En resumen, las unidades de disco duro SATA y los controladores SATA son productos baratos. Son productos de mercado masivo y tienen un precio muy bajo. Al construir un gran grupo de PC baratas con unidades SATA baratas, Google, Amazon y otros obtienen una gran capacidad a un precio muy bajo. Luego agregan su propia capa de software en la parte superior. Su software realiza la replicación multiservidor para obtener rendimiento y confiabilidad, monitoreo, reequilibrar la replicación después de una falla de hardware y otras cosas.
Puede echar un vistazo a MogileFS como un representante más simple del tipo de software que Google, Amazon y otros usan para el almacenamiento. Por supuesto, es una implementación diferente, pero comparte muchos de los mismos objetivos de diseño y soluciones que los sistemas a gran escala. Si lo desea, aquí hay un punto de partida para aprender más sobre GoogleFS .
más adelante en el documento, Clouds debería usar SAN o NAS porque DAS no es apropiado cuando una VM se mueve a otro servidor
Hay 2 razones por las cuales no se usan SAN.
1) precio.
Los SAN son enormemente caros a gran escala. Si bien pueden ser la "mejor" solución técnica, normalmente no se utilizan en instalaciones a gran escala debido al costo.
2) El teorema CAP El teorema CAP de
Eric Brewer muestra que a una escala muy grande no se puede mantener una consistencia fuerte mientras se mantiene una confiabilidad aceptable, tolerancia a fallas y rendimiento. Los SAN son un intento de hacer una fuerte consistencia en el hardware. Eso puede funcionar bien para una instalación de 5.000 servidores, pero nunca se ha demostrado que funcione para los más de 250.000 servidores de Google.
Resultado:
hasta ahora, los proveedores de computación en la nube han optado por impulsar la complejidad de mantener el estado del servidor al desarrollador de la aplicación. Las ofertas actuales de la nube no proporcionan un estado coherente para cada máquina virtual. Los servidores de aplicaciones (máquinas virtuales) pueden fallar y sus datos locales se pueden perder en cualquier momento.
Cada proveedor tiene su propia implementación de almacenamiento persistente, que se supone que debe usar para datos importantes. Las ofertas de Amazon son buenos ejemplos; MySQL , SimpleDB y Simple Storage Service . Estas ofertas en sí reflejan el teorema de CAP: la instancia de MySQL tiene una fuerte consistencia, pero una escalabilidad limitada. SimpleDB y S3 se escalan fantásticamente, pero finalmente son consistentes.