Tengo un servidor HP con controlador SmartArray P400 (incluido 256 MB de caché / respaldo de batería) con una unidad lógica con unidad física defectuosa reemplazada que no se reconstruye.
Así es como se veía cuando detecté el error:
~ # / usr / sbin / hpacucli ctrl slot = 0 show config Smart Array P400 en la ranura 0 (integrada) (sn: XXXX) matriz A (SATA, espacio no utilizado: 0 MB) Logicaldrive 1 (698.6 GB, RAID 1, OK) physicaldrive 1I: 1: 1 (puerto 1I: casilla 1: bahía 1, SATA, 750 GB, OK) physicaldrive 1I: 1: 2 (puerto 1I: casilla 1: bahía 2, SATA, 750 GB, OK) matriz B (SATA, espacio no utilizado: 0 MB) Logicaldrive 2 (2.7 TB, RAID 5, Fallido) physicaldrive 1I: 1: 3 (puerto 1I: casilla 1: bahía 3, SATA, 750 GB, OK) physicaldrive 1I: 1: 4 (puerto 1I: casilla 1: bahía 4, SATA, 750 GB, OK) physicaldrive 2I: 1: 5 (puerto 2I: casilla 1: bahía 5, SATA, 750 GB, OK) physicaldrive 2I: 1: 6 (puerto 2I: casilla 1: bahía 6, SATA, 750 GB, Fallido) physicaldrive 2I: 1: 7 (puerto 2I: casilla 1: bahía 7, SATA, 750 GB, OK) no asignado physicaldrive 2I: 1: 8 (puerto 2I: casilla 1: bahía 8, SATA, 750 GB, OK) ~ #
Pensé que tenía la unidad 2I: 1: 8 configurada como repuesto para la matriz A y la matriz B, pero parece que este no fue el caso :-(. Noté el problema debido a errores de E / S en el host, incluso si solo falla 1 unidad física del RAID5.
¿Alguien sabe por qué esto podría suceder? ¿El logicaldrive debe entrar en modo "Degradado" pero aún así ser completamente accesible desde el sistema operativo host?
Primero intenté agregar la unidad no asignada 2I: 1: 8 como repuesto para logicaldrive 2, pero esto no fue posible:
~ # / usr / sbin / hpacucli ctrl slot = 0 array B agregar repuestos = 2I: 1: 8 Error: esta operación no es compatible con la configuración actual. Use el comando "show" en dispositivos para mostrar detalles adicionales Sobre la configuración. ~ #
Curiosamente, es posible agregar la unidad no asignada a la primera matriz sin problemas. Pensé que tal vez el controlador puso la matriz en estado "fallido" debido a la falta de repuesto y protege las matrices fallidas de modificaciones. Así que traté de volver a habilitar Logicaldrive (para agregar el repuesto después):
~ # / usr / sbin / hpacucli ctrl slot = 0 ld 2 modificar reenable Advertencia: es posible que los datos existentes anteriormente en la unidad lógica no ser válido o recuperable ¿Seguir? (y / n) y Error: esta operación no es compatible con la configuración actual. Use el comando "show" en dispositivos para mostrar detalles adicionales Sobre la configuración. ~ #
Pero como puede ver, volver a habilitar Logiveldrive no fue posible.
Ahora reemplacé la unidad fallida al cambiarla por la unidad no asignada. El estado ahora se ve así:
~ # / usr / sbin / hpacucli ctrl slot = 0 show config Smart Array P400 en la ranura 0 (integrada) (sn: XXXX) matriz A (SATA, espacio no utilizado: 0 MB) Logicaldrive 1 (698.6 GB, RAID 1, OK) physicaldrive 1I: 1: 1 (puerto 1I: casilla 1: bahía 1, SATA, 750 GB, OK) physicaldrive 1I: 1: 2 (puerto 1I: casilla 1: bahía 2, SATA, 750 GB, OK) matriz B (SATA, espacio no utilizado: 0 MB) Logicaldrive 2 (2.7 TB, RAID 5, Fallido) physicaldrive 1I: 1: 3 (puerto 1I: casilla 1: bahía 3, SATA, 750 GB, OK) physicaldrive 1I: 1: 4 (puerto 1I: casilla 1: bahía 4, SATA, 750 GB, OK) physicaldrive 2I: 1: 5 (puerto 2I: casilla 1: bahía 5, SATA, 750 GB, OK) physicaldrive 2I: 1: 6 (puerto 2I: casilla 1: bahía 6, SATA, 750 GB, OK) physicaldrive 2I: 1: 7 (puerto 2I: casilla 1: bahía 7, SATA, 750 GB, OK) ~ #
La unidad lógica todavía no es accesible. ¿Por qué no está reconstruyendo?
¿Que puedo hacer?
FYI, esta es la configuración de mi controlador:
~ # / usr / sbin / hpacucli ctrl slot = 0 mostrar Smart Array P400 en la ranura 0 (integrado) Interfaz de bus: PCI Ranura: 0 Número de serie: XXXX Número de serie de caché: XXXX Estado RAID 6 (ADG): habilitado Estado del controlador: OK Ranura del chasis: Revisión de hardware: Rev E Versión de firmware: 5.22 Prioridad de reconstrucción: media Expandir Prioridad: Media Retraso de escaneo de superficie: 15 segundos Notificación de inconsistencia de análisis de superficie: deshabilitado Almacenamiento intermedio de escritura de Raid1: deshabilitado Tiempo de espera posterior a la solicitud: 0 segundos Tablero de caché presente: verdadero Estado de caché: OK Relación del acelerador: 25% de lectura / 75% de escritura Caché de escritura de unidad: deshabilitado Tamaño total de caché: 256 MB Caché de escritura sin batería: deshabilitado Fuente de alimentación de respaldo de caché: baterías Recuento de batería / condensador: 1 Estado de la batería / condensador: OK SATA NCQ compatible: verdadero ~ #
Gracias por su ayuda de antemano.