¿Qué es una red de área de almacenamiento y qué beneficios tiene sobre las diferentes soluciones de almacenamiento?

Propongo que sea una pregunta canónica sobre las redes de área de almacenamiento de nivel empresarial.

¿Qué es una red de área de almacenamiento (SAN) y cómo funciona?
¿En qué se diferencia de un almacenamiento conectado a la red (NAS)?
¿Cuáles son los casos de uso en comparación con el almacenamiento de conexión directa (DAS)?
¿De qué manera es mejor o peor?
¿Por qué es tan caro?
¿Debería (o mi empresa) usar uno?

storage storage-area-network network-attached-storage

— Massimo
fuente

@Basil: ¿crees que la pregunta también debería cubrir los NAS? Son cosas fundamentalmente diferentes de SAN (y ya hay una pregunta que las compara: serverfault.com/questions/81723/… ). Tenía la intención de que este fuera específicamente sobre SAN. No estoy eliminando su edición, pero agradecería los comentarios de la comunidad al respecto.

— Massimo

La presentación de archivos es típicamente una función de la mayoría de los dispositivos de almacenamiento en el mercado ahora que la mayoría de la gente llamaría una "SAN".

— Basil

Creo que la pregunta que vinculé cubre esto bastante bien, y también los NAS son conceptualmente mucho más simples (básicamente son servidores de archivos). Una SAN es más compleja, modular y costosa. Ampliar el alcance de esta pregunta a todas las formas de almacenamiento lo haría demasiado amplio. Esta es, por supuesto, mi opinión.

— Massimo

Mi punto es que cada solución de almacenamiento que puede obtener ahora tiene un servicio de archivos integrado. EMC, HDS, IBM, HP, Netapp (obviamente), Dell. No se puede hablar de una "SAN" (de nuevo, un nombre inapropiado, ya que eso es lo que usted describe como la capa de conectividad) sin hablar de la publicación de archivos. ¿Podrías entrar a la sala de comunicaciones?

— Basil

Me gusta cómo ha resultado esto. Creo que es mejor que esta pregunta se centre en qué es una SAN y solo mencione NAS de pasada. Esa pregunta anterior sobre "¿cuál es la diferencia entre SAN, NAS, DAS?" podría actualizarse un poco y convertirse en un Q&A canónico por sí solo.

— Ward - Restablece a Monica

En primer lugar, para una comparación (amplia) del almacenamiento DAS, NAS y SAN, consulte aquí .

Hay algunos conceptos erróneos comunes sobre el término " SAN ", que significa " Red de área de almacenamiento " y, como tal, estrictamente hablando , se refiere solo a la infraestructura de comunicación que conecta dispositivos de almacenamiento (matrices de discos, bibliotecas de cintas, etc.) y usuarios de almacenamiento (servidores ) Sin embargo, en la práctica común, el término "SAN" se usa para referirse a dos cosas:

Una infraestructura de almacenamiento completa, que incluye todo el hardware y software involucrado en proporcionar acceso compartido a dispositivos de almacenamiento central desde múltiples servidores. Este uso, aunque no es estrictamente correcto, es comúnmente aceptado y a lo que la mayoría de la gente se refiere cuando habla de una "SAN". El resto de esta respuesta se centrará en ella, describiendo así cada componente de una infraestructura de almacenamiento de nivel empresarial.
Una sola matriz de almacenamiento (ver más adelante); como en "tenemos una SAN Brand X con 20 TB de almacenamiento". Este uso es fundamentalmente incorrecto, porque ni siquiera tiene en cuenta el significado real de "SAN" y simplemente supone que es algún tipo de dispositivo de almacenamiento.

Una SAN puede estar compuesta de hardware muy diferente, pero generalmente se puede dividir en varios componentes:

Matrices de almacenamiento : aquí es donde los datos se almacenan realmente (y lo que erróneamente se llama "SAN" con bastante frecuencia). Se componen de:
- Discos físicos: ellos, por supuesto, archivan los datos. Se utilizan discos de nivel empresarial, lo que significa que generalmente tienen una capacidad por disco más baja, pero un rendimiento y confiabilidad mucho más altos; Además, son mucho más caros que los discos de clase de consumidor. Los discos pueden usar una amplia gama de conexiones y protocolos ( SATA , SAS , FC , etc.) y diferentes medios de almacenamiento ( los discos de estado sólido son cada vez más comunes), dependiendo de la implementación específica de SAN.
- Gabinetes de disco: aquí es donde se colocan los discos. Les proporcionan electricidad y conexiones de datos.
- Controladores / procesadores de almacenamiento: administran las E / S de disco, RAID y almacenamiento en caché (el término "controlador" o "procesador" varía entre los proveedores de SAN). Nuevamente, se utilizan controladores de nivel empresarial, por lo que tienen un rendimiento y una confiabilidad mucho mejores que el hardware de clase de consumidor. Pueden, y generalmente están, configurados en pares para redundancia.
- Grupos de almacenamiento : un grupo de almacenamiento es un montón de espacio de almacenamiento, que comprende algunos (a menudo muchos) discos en una configuración RAID. Se llama "grupo" porque se pueden asignar, redimensionar y desasignar secciones a pedido, creando LUN.
- Números de unidad lógica (LUN): un LUN es una porción de espacio extraída de un grupo de almacenamiento, que luego se pone a disposición ("presentado") a uno o más servidores. Los servidores lo ven como un volumen de almacenamiento y pueden formatearlo utilizando cualquier sistema de archivos que prefieran.
Bibliotecas de cintas: se pueden conectar a una SAN y utilizar la misma tecnología de comunicaciones tanto para conectarse a servidores como para copias de seguridad directas de almacenamiento a cinta.
Red de comunicaciones ( la "SAN" adecuada ): esto es lo que permite a los usuarios de almacenamiento (servidores) acceder a los dispositivos de almacenamiento (matriz (s) de almacenamiento, bibliotecas de cintas, etc.); es, estrictamente hablando, el significado real del término "Red de área de almacenamiento", y la única parte de una infraestructura de almacenamiento que debe definirse como tal. Realmente hay muchas soluciones para conectar servidores a dispositivos de almacenamiento compartido, pero las más comunes son:
- Fibre Channel : una tecnología que utiliza fibra óptica para conexiones de alta velocidad al almacenamiento compartido. Incluye adaptadores de bus host , cables de fibra óptica y conmutadores FC, y puede alcanzar velocidades de transferencia que van desde 1 Gbit a 20 Gbit. Además, las E / S de múltiples rutas se pueden usar para agrupar varios enlaces físicos, lo que permite un mayor ancho de banda y tolerancia a fallas.
- iSCSI : una implementación delprotocolo SCSI sobre transporte IP. Se ejecuta sobrehardware Ethernet estándar, lo que significa que puede alcanzar velocidades de transferencia de 100 Mbit (generalmente no se utilizan para SAN) a 100 Gbit. También se puede usar E / S de múltiples rutas (aunque la capa de red subyacente presenta algunas complejidades adicionales).
- Fibre Channel over Ethernet (FCoE) : una tecnología entre FC completo e iSCSI, que utiliza Ethernet como capa física pero FC como protocolo de transporte, evitando así la necesidad de una capa IP en el medio.
- InfiniBand : una tecnología de conectividad de muy alto rendimiento, menos utilizada y bastante cara, pero que puede lograr unancho de banda impresionante .
Adaptadores de bus host (HBA): las tarjetas adaptadoras utilizadas por los servidores para acceder a la capa de conectividad; pueden ser adaptadores dedicados (como en FC SAN) o tarjetas Ethernet estándar. También hay HBA iSCSI, que tienen una conexión Ethernet estándar, pero pueden manejar el protocolo iSCSI en hardware, liberando así al servidor de una carga adicional.

Una SAN proporciona muchas capacidades adicionales sobre el almacenamiento conectado directamente (o físicamente compartido):

Tolerancia a fallas: la alta disponibilidad está integrada en cualquier SAN de nivel empresarial y se maneja en todos los niveles, desde las fuentes de alimentación en los arreglos de almacenamiento hasta las conexiones del servidor. Los discos son más confiables, RAID se usa para resistir fallas de un solo disco (o múltiples discos), se emplean controladores redundantes y la E / S de múltiples rutas permite el acceso ininterrumpido al almacenamiento incluso en el caso de una falla del enlace.
Mayor capacidad de almacenamiento: las SAN pueden contener muchos dispositivos de almacenamiento de gran tamaño, lo que permite espacios de almacenamiento mucho mayores de lo que podría lograr un solo servidor.
Gestión de almacenamiento dinámico: los volúmenes de almacenamiento (LUN) se pueden crear, redimensionar y destruir bajo demanda; se pueden mover de un servidor a otro; la asignación de almacenamiento adicional a un servidor requiere solo algunas configuraciones, en lugar de comprar discos e instalarlos.
Rendimiento: una SAN configurada correctamente, que utiliza tecnologías recientes (aunque costosas), puede lograr un rendimiento realmente impresionante y está diseñada desde cero para manejar una gran carga simultánea de múltiples servidores.
Replicación a nivel de almacenamiento: se pueden configurar dos (o más) matrices de almacenamiento para la replicación síncrona, lo que permite la redirección completa de E / S del servidor de una a otra en situaciones de falla o desastre.
Instantáneas de nivel de almacenamiento : la mayoría de las matrices de almacenamiento permiten tomar instantáneas de volúmenes individuales y / o agrupaciones de almacenamiento completas. Esas instantáneas se pueden restaurar si es necesario.
Copias de seguridad a nivel de almacenamiento: la mayoría de las SAN también permiten realizar copias de seguridad directamente desde matrices de almacenamiento a bibliotecas de cintas conectadas a SAN, omitiendo por completo los servidores que realmente usan los datos; Se emplean varias técnicas para garantizar la integridad y la coherencia de los datos.

Basado en todo lo anterior, los beneficios de usar SAN son obvios; pero ¿qué pasa con los costos de comprar uno y la complejidad de administrar uno?

Las SAN son hardware de nivel empresarial (aunque puede haber un caso de negocio para pequeñas SAN incluso en pequeñas y medianas empresas); son, por supuesto, altamente personalizables, por lo que pueden variar desde "un par de TB con iSCSI de 1 Gbit y una confiabilidad algo alta" hasta "varios cientos de TB con una velocidad, rendimiento y confiabilidad sorprendentes y una replicación síncrona completa en un centro de datos DR"; los costos varían en consecuencia, pero generalmente son más altos (como en "costo total", así como en "costo por gigabyte de espacio") que otras soluciones. No existe un estándar de precios, pero no es raro que incluso las SAN pequeñas tengan etiquetas de precios en el rango de decenas de miles (e incluso cientos de miles) de dólares.

Diseñar e implementar una SAN (aún más para una de gama alta) requiere habilidades específicas, y este tipo de trabajo generalmente lo realizan personas altamente especializadas. Las operaciones diarias, como la administración de LUN, son considerablemente más fáciles, pero en muchas empresas la administración del almacenamiento es manejada por una persona o equipo dedicado.

Independientemente de las consideraciones anteriores, las SAN son la solución de almacenamiento elegida donde se requiere alta capacidad, confiabilidad y rendimiento.

— Massimo
fuente

Vote ++ por una respuesta tan profunda.

— Simon Catlin

¿Necesitas uno? Depende £ o $ por TB es considerablemente más alto que el DAS. Además, me temo que el rendimiento de DAS supera a FC / AL e iSCSI SAN (bueno, al menos en mis pruebas con Oracle y SQL Server DB). Pero, con DAS, no obtienes los beneficios de poder compartir almacenamiento (bueno para clustering y VMWare).

Varios proveedores de almacenamiento están migrando fuera del canal de fibra para las conexiones del controlador de host a almacenamiento, a favor de iSCSI, que se ejecuta sobre Ethernet. Es la vieja saga Token-Ring vs Ethernet de nuevo; Con tanta investigación e inversión en Ethernet en toda la industria, FC simplemente no puede mantenerse al día. Un conmutador Ethernet de 10 Gbps es mucho más barato que uno de FC de 8 Gbps, además puede ser vLANd o segmentado de otro modo para proporcionar datos de almacenamiento y sin almacenamiento.

Sin embargo, hay algunos grandes beneficios de las SAN:

Instantáneas de SAN (punto de recuperación en un punto en el tiempo para un servidor o colección de servidores)
Replicación a nivel de bloque en el sitio y fuera del sitio (sin involucrar al servidor host, por lo que no es necesario realizar una replicación basada en software)
Copias de seguridad SAN directas: si su sistema de copia de seguridad puede conectarse y trabajar con su SAN

Si está considerando sumergir su dedo del pie en el agua del almacenamiento compartido, mire productos como el kit P4000 de HP.

— Simon Catlin
fuente