La mejor práctica para 24 Disk Array


9

Acabamos de migrar para nuestro antiguo almacenamiento SAN de fibra a un IBM v3700 storwize con 24 discos SAS de 600 GB.

Este almacenamiento está conectado directamente a dos servidores IBM ESXi 5.5, cada uno con dos controladores SAS de múltiples rutas de 6 Gbps.

Hasta ahora, he configurado el almacenamiento que he usado en múltiples grupos RAID5. Cada grupo sería para un servidor / propósito diferente. Principalmente los grupos RAID serían OracleDB, archivo de Oracle, SQL Server y el resto (servidor de archivos, correo, etc.). Las aplicaciones más críticas son Oracle y SQL Server.

Mi primera preocupación es la seguridad y luego el rendimiento de nuestras aplicaciones. Así que he decidido ir con RAID6 + repuesto (s).

Mi principal preocupación ahora es, dado que estamos usando ESXi, ¿debería configurar todo el almacenamiento en un solo RAID, ahorrar espacio y crear volúmenes de almacenamiento de datos desde ESXi para cada servidor, o no es una buena práctica y es mejor crear por separado grupos RAID de hardware?


44
Las personas que votan para cerrar esto: esta no es una pregunta basada en una opinión, es una pregunta de mejores prácticas. Hay una respuesta del proveedor, y está en el tema en serverfault.
Albahaca

Respuestas:


7

Cada proveedor tiene sus propias recomendaciones, así que comience preguntando a IBM. Puede abrir un ticket solicitando consejos de configuración sin tener que pagar un soporte adicional, por lo general. Eso o quien te lo vendió puede.

Brevemente buscando en Google, descubrí este libro rojo . En la página 212, es probable que desee una incursión básica 6, lo que significa 1 repuesto y unidades por objetivo de matriz de 12. Eso significará dos incursiones, una de 12, una de 11. No recomendaría la incursión 10, porque pierde la mitad de su capacidad. Evita la paridad, pero eso es algo de lo que solo debe preocuparse en el almacenamiento interno o de gama baja. Su almacenamiento ocultará la paridad de sobrescrituras aleatorias detrás del caché. Mi tienda usa raid 6 exclusivamente por medio petabyte de VMWare 5.5, y está bien.

Deberías leer ese libro y entender cómo funcionan los mdisks y los pools. Desea crear un grupo de bandas anchas en todos sus ejes, una vez que se configuran sus grupos de incursiones.


4

Descargo de responsabilidad : esto está altamente basado en la opinión y ha marcado la pregunta como tal, pero intentaré ofrecer una respuesta ya que recientemente configuré casi la misma configuración.

Dudo mucho que cualquier tipo de base de datos funcione bien en una matriz RAID5 o 6. La mayoría de los vendedores están desalentando activamente (e incluso en los casos que prohíben) el uso de niveles RAID basados ​​en paridad no controlados debido a los altos tiempos de reconstrucción, lo que conduce a un mayor riesgo o un URE durante una reconstrucción.

Yo personalmente dividiría esto en dos grupos distintos: un RAID10 para su carga de alto IO, como bases de datos, y un RAID50 para el resto de sus datos. La cantidad de discos que dedica para cada matriz depende de la cantidad de datos que necesita almacenar.

Por ejemplo, para su matriz de 24 discos, puede perder dos discos por repuestos de gabinete y crear cuatro tramos de 2 discos (por lo tanto, 8 discos en total) para obtener un RAID10 lógico de alrededor de 2.4TB. Eso te deja con 14 discos para tu RAID50, con 7 discos por tramo y alrededor de 7,2 TB de espacio disponible. Por supuesto, puede hacer malabares con el número de tramos, pero tenga en cuenta que los RAID10 necesitan múltiplos de 2.

En cuanto a los almacenes de datos, en realidad no hace una gran diferencia si no está utilizando características sofisticadas como Storage vMotion y DRS para barajar los recursos.

Además, para aclarar su último párrafo: más discos más pequeños generalmente son preferibles a discos menos grandes debido a la cantidad de tiempo que lleva reconstruir un disco fallido y la carga colocada en los otros discos durante la reconstrucción.


Tengo que estar de acuerdo con usted y seguir sus consejos para RAID10 para la base de datos. No estoy seguro de que RAID50 sea compatible con v3700 ya que sube a RAID10. ¿Se hace esto en una configuración de dos etapas desde el administrador de almacenamiento?
teo

66
Su marca es incorrecta: esta es una pregunta específica con una respuesta específica y correcta. Hay un libro rojo de IBM que contiene la información solicitada. Además, su comentario sobre las incursiones 5 y 6 es incorrecto para el almacenamiento empresarial. Los tiempos de reconstrucción en una incursión de 600 GB en 12 unidades no son las reconstrucciones de varias semanas que obtienes en unidades 7200 de 4 TB. Además, la incursión 50 no existe en este almacenamiento, usan piscinas anchas rayadas que contienen extensiones de múltiples grupos de incursiones de incursiones 5, 6 o 10.
Albahaca

1

Nunca elegiría un RAID6, o incluso 5 para las cargas de trabajo de estilo de base de datos. Como están basados ​​en la paridad, incurren en una penalización de escritura alta y los tiempos de reconstrucción pueden ser ENORMES.

RAID 10 le dará el mejor rendimiento, puede sobrevivir a una falla de cada lado de la matriz y puede asignar un repuesto dinámico o dos para asegurarse de que la matriz recupere su redundancia rápidamente en caso de que falle una unidad.

En términos de división de almacenamiento y presentación ... Normalmente sigo un esquema de 1 LUN por grupo RAID, cada LUN contiene varios discos VM.


3
Los tiempos de reconstrucción en un disco SAS de 600 GB no son enormes. Su consejo es cierto para el almacenamiento local de 7200 RPM, no para el almacenamiento empresarial con un caché de escritura de controlador grande y husillos pequeños y rápidos. Además, para VMWare 5.5, se recomiendan dos LUN por almacén de datos, y se deben usar franjas anchas siempre que sea posible para que cada LUN tenga acceso al rendimiento subyacente de todos los ejes, no solo una matriz.
Albahaca

1
De cualquier manera, el RAID basado en paridad es lento en comparación con stripe & mirror (tanto el rendimiento como la reconstrucción) y solo necesita usarse donde la capacidad es la preocupación, no IOPS y el rendimiento.
tomstephens89

44
El problema con las reconstrucciones de RAID 5 es menos el tiempo que lleva completar, sino la cantidad de datos que deben leerse (es decir: todos los datos de los discos supervivientes) sin un solo error de lectura irrecuperable:
Hagen von Eitzen

1
No estoy recomendando la incursión 5, Hagen. Estoy recomendando la incursión 6. Y Tom, la pregunta dice que tienen 24 discos SAS de 600 GB. No es una gran variedad de discos lentos grandes, ni ningún SSD (no importa cuán establecida sea la tecnología). Esta pregunta es muy explícita y clara.
Albahaca

2
Las tasas de error irrecuperables en las unidades empresariales suelen ser cien veces mejores que los modelos de escritorio. Esa preocupación por las reconstrucciones no es particularmente significativa.
Sobrique
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.