Hemos luchado con el controlador RAID en nuestro servidor de base de datos, un Lenovo ThinkServer RD120. Es un Adaptec renombrado que Lenovo / IBM dobla el ServeRAID 8k .
Hemos parcheado este ServeRAID 8k hasta lo último y lo mejor:
- Versión de BIOS RAID
- Versión de BIOS del plano posterior RAID
- Controlador de Windows Server 2008
Este controlador RAID ha tenido múltiples actualizaciones críticas de BIOS incluso en el corto tiempo de 4 meses que hemos tenido, y el historial de cambios es simplemente ... bueno, aterrador.
Hemos probado estrategias de reescritura y reescritura en las unidades RAID lógicas. Todavía obtenemos errores de E / S intermitentes bajo actividad de disco pesado. No son comunes, pero graves cuando suceden, ya que provocan tiempos de espera de E / S de SQL Server 2008 y, a veces, fallas de los grupos de conexiones SQL.
Estábamos al final de nuestra cuerda resolviendo este problema. A falta de cosas difíciles como reemplazar todo el servidor o reemplazar el hardware RAID, nos estábamos desesperando.
Cuando obtuve el servidor por primera vez, tuve un problema en el que no se reconocía el compartimiento para unidades # 6. Cambiando los discos duros a una marca diferente, extrañamente, solucionó esto, y la actualización del BIOS RAID (por primera vez) lo solucionó permanentemente, por lo que pude usar la unidad original "incompatible" en el compartimento 6. En un presentimiento, comencé a asumir que los discos duros Western Digital SATA que elegí eran de alguna manera incompatibles con el controlador ServeRAID 8k.
Comprar 6 discos duros nuevos era una de las opciones más baratas sobre la mesa, así que elegí 6 discos duros Hitachi (también conocido como IBM, también conocido como Lenovo) bajo la teoría de que un controlador RAID de IBM / Lenovo es más probable que funcione con los discos. vendido con.
Parece que esa corazonada valió la pena: hemos pasado por tres de nuestros días de mayor carga (lunes, martes, miércoles) sin un solo error de E / S de ningún tipo. Antes de esto, regularmente teníamos al menos un "evento" de E / S en este período de tiempo. ¡Parece que cambiar de marca de disco duro ha solucionado nuestros problemas de E / S RAID intermitentes!
Si bien entiendo que IBM / Lenovo probablemente pruebe su controlador RAID exclusivamente con su propia marca de discos duros, me preocupa que un controlador RAID tenga problemas de E / S tan sutiles con marcas particulares de discos duros.
Entonces mi pregunta es, ¿ es este tipo de incompatibilidad de unidad SATA común con los controladores RAID? ¿Hay algunas marcas de unidades que funcionan mejor que otras, o están "validadas" contra un controlador RAID particular? Asumí que todos los discos duros SATA básicos eran iguales y funcionarían razonablemente bien en cualquier controlador RAID (de calidad suficiente).