Soporte de señal de falla de HDD Soft-Raid


1

Tengo un proyecto de servidor doméstico en el que he estado trabajando durante un tiempo. Es un servidor web y de almacenamiento de archivos / copia de seguridad. Se ejecuta en Debian 8. He estado pensando en actualizar mis opciones de almacenamiento ya que me estoy quedando sin espacio a aproximadamente. 5TB.

Lo que me gustaría poder hacer es configurar un sistema de archivos ZFS que comience con 4 x 2TB HHD. (Almacenamiento de 6 TB y paridad de 2 TB) Estaba buscando comprar el Icy Dock MB455SPF-B y noté que los LED admiten una señal roja de "falla de HDD". En letra pequeña dice:

* la señal de falla del disco duro es proporcionada por un host externo, como una tarjeta controladora RAID o una placa base. Asegúrese de que su tarjeta controladora / placa base pueda proporcionar una señal de falla del disco duro a través del pin de voltaje para usar esta función.

Me gustaría poder usar esta función para ayudar a eliminar cualquier error si necesito reemplazar una unidad. Pero no estoy seguro sobre el soporte para esta "señal de falla". No la vi listada en ninguna de las especificaciones de mobo que he visto, ni en los controladores sata. ¿Es una característica común? ¿O es generalmente algo que tienen las cartas de banda? Si mi mobo no lo tiene. ¿Puedo comprar una tarjeta controladora sata que lo haga? (No quiero una tarjeta de banda completa) Además, ¿debo suponer que el software ZFS también debe ser compatible? ¿Es eso un tipo estandarizado de cosas?

gracias por el conocimiento!

Configuración actual / Explicaciones:

  • Mobo: Intel D925XBC con Intel P4 de un solo núcleo (sí, antiguo)
  • HHD: 2 x 1 TB, 1 x 3 TB
  • Buscando actualizar todo, ya que obviamente es bastante viejo. Estaba pensando en comenzar con los discos duros por ahora. Probablemente todavía envejezca, use cosas ya que no hace nada demasiado intenso.
  • ZFS porque es un volumen bastante grande, por lo que la capacidad de expansión de la incursión es agradable. La mayoría de los datos son para el almacenamiento a largo plazo, por lo que no quiero preocuparme de que ocurra una corrupción de datos lenta y silenciosa mientras no la estoy viendo. Y una paridad también es agradable.
  • soft-raid porque ... bueno, creo que ZFS solo viene como raid de software ¿verdad? también porque no necesita un rendimiento loco y no quiero lidiar con tener que encontrar exactamente el mismo controlador de banda si muere.

EDITAR:

Así que estoy empezando a tener la impresión de que esto es prácticamente solo una cuestión de servidor. y que los entusiastas no se molestan. Lo que me parece extraño, habría pensado que más luces parpadeantes serían el aliado de la mayoría de las personas.

Después de continuar leyendo, parece que el área de "LED de falla" es algo variada y no estándar.

Por lo que puedo decir, la única forma segura es comprar un servidor de montaje en bastidor real, con una tarjeta RAID que esté hecha para comunicarse con el plano posterior del HDD. De esa manera, todo se controla a través de la tarjeta RAID, hace todo el LED de falla.

Si está construyendo su propia unidad, con raid de software. Hay cosas como SGPIO que deberían funcionar, pero parece tener varios nombres, SFF-8485, IPASS, y podría ser parte de mini-sas. Nada parece totalmente claro. ¿También creo que SES-2 puede hacerlo? Cómo el gabinete Icy Dock que noté en mi pregunta hace que esté más allá de mí, básicamente NO hay documentación. Parece que hay algunas utilidades como ledmon que pueden usar un HBA habilitado con SGPIO para controlar los LED, pero lo harás manualmente o mediante un script hecho en casa.

Entonces, siempre que pueda encontrar un HBA que tenga SGPIO (en su mayoría unidades de servidor, no tan difícil de encontrar, pero costoso) y un gabinete HDD que también usa SGPIO (también principalmente cosas de servidor, mucho más difícil de encontrar porque generalmente esto es solo el frente del bastidor del servidor) Y puede hacerse un buen script confiable que verifique el estado de sus HDD y actualice los LED en consecuencia. deberías estar listo


1
El enfoque de baja tecnología es etiquetar cada disco con un identificador (visible antes de desconectar cualquier cableado) y usar ese identificador en la definición del grupo.
un CVn

Creo que una parte de la razón por la cual esta pregunta no ha recibido tanta atención es que tiene mucho contenido superfluo que no está relacionado con la pregunta real que está haciendo. Recomiendo podar mucho , así como resaltar la pregunta específica para que sea más fácil de detectar. Además, una pregunta por publicación, no más. Si tiene problemas para encontrar un buen resumen de su pregunta para usar en el título, ¿cómo vamos a poder decir lo que necesita saber?
un CVn

Respuestas:


0

Sus suposiciones son correctas, esta característica no es realmente buscada en el mercado de consumo. La mayoría de las personas tiene de 2 a 6 discos como máximo, por lo que etiquetarlos como Michael sugirió es bastante simple, económico y fácil. Después de todo, probablemente no obtendrá 2 discos muertos por hora, pero tal vez un disco muerto en 3 años. Además, los LED pueden molestarlo si su servidor está en su sala de estar o dormitorio.

Por otro lado, imagine que tiene 50 bastidores, cada uno con 10 sistemas, cada sistema tiene 24 discos, 12000 discos en total. Puede que tenga que cambiar varios discos cada día. Se vuelve mucho más importante poder ir al bastidor e identificar rápidamente el disco correcto. Leer 240 números de serie rápidamente te volvería loco, mientras que quitar el disco incorrecto por accidente te reinaría. Entonces, lo que debe hacer es usar las luces para localizar rápidamente el disco candidato y luego leer y verificar el número de serie en la etiqueta, comparándolo con la información de su informe de errores (porque cada software puede tener errores).

Además, la definición de "unidad defectuosa" no es la misma para todas las personas y situaciones. Una bahía vacía (sin conexión a la unidad) podría ser un fallo de conexión grave o simplemente el mantenimiento de rutina de su matriz raidz3. Un disco en funcionamiento que devuelve algunos errores de lectura podría ser un signo de una condición crítica y la necesidad de un reemplazo inmediato, o nada de lo que preocuparse si está por debajo de un cierto umbral en un período de tiempo determinado.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.