Tengo un disco en un software RAID-1 de dos discos para el que recientemente apareció un "sector inaccesible sin conexión" en el estado INTELIGENTE.
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
Aparentemente, esto es solo una señal de falla inminente del disco si ocurre con una frecuencia cada vez mayor (y dado que la unidad está duplicada, tampoco existe un gran riesgo de pérdida de datos real). En ese momento, una autocomprobación también falló en algún momento y smartd
me envió un correo electrónico para notificarme sobre esto, como debería ser.
Sin embargo, escribir en el sector dañado generalmente hace que el disco use uno de sus sectores libres en lugar de lo que aparentemente hizo porque, dado que dd
edité sobre el disco, todas las autocomprobaciones funcionaron bien. Y badblocks
tampoco encontró razón para quejarse.
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
[...]
# 5 Extended offline Completed without error 00% 5559 -
# 6 Short offline Completed without error 00% 5540 -
# 7 Short offline Completed: read failure 90% 5524 63273368
El número de sectores defectuosos no disminuyó, aunque no debería, en realidad, ya que el sector roto todavía está allí, aunque sin usar. Sin embargo, smartd
continúa enviándome correos electrónicos todas las noches:
The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
Obviamente, esto es extremadamente molesto y adormece mi saludable reflejo de pánico en los smartd
correos.
El disco es un Western Digital WD20EARS y la smartd
versión es 5.41 2011-06-09 r3365.
-U 198+
Deberías hacerlo. Buen hallazgo!