¿Método rápido para determinar el estado de la unidad SSD?

13

Tengo una unidad Intel X-25M que fue marcada como "fallida" dos veces en una matriz de almacenamiento ZFS, como se señaló aquí . Sin embargo, después de quitar la unidad, parece montarse, leer y escribir en otras computadoras (Mac, PC, carcasa USB, etc.)

¿Hay una buena manera de determinar el estado actual de la unidad? Creo que la falla anterior en la solución ZFS fue la convergencia de errores, informes de errores y hardware. Sin embargo, parece que esta unidad puede tener algo de vida.

— ewwhite
fuente

¿Es un g1 o un g2?

— Jim B

Esta es una unidad G2 120GB X25-M.

— ewwhite

12

Una buena forma, pero no infalible, de verificar el estado de cualquier unidad es verificar los atributos SMART.

A continuación se muestra el conjunto de atributos SMART para un disco Intel X25-M G2 160GB, tomado con smartctl v5.41. (La versión es importante, las versiones anteriores de smartctl tenían asignaciones de nombre de atributo diferentes y en realidad no entendían correctamente la tabla específica para esta unidad).

# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED     RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4076
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       67
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148418
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       755
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       49
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       16956537
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

Esto muestra que la unidad ha tenido 1 sector reasignado, ha utilizado el 1% de su espacio reservado disponible (atributo 232) y el 2% de sus ciclos proyectados de programa / borrado (atributo 233). Se le han escrito 148418 * 32MiB (atributo 225).

Si la unidad muestra un número significativo de sectores reasignados, puede ser motivo de preocupación, ya que esto probablemente apunta a un chip flash defectuoso (de la misma manera que un número significativo de sectores reasignados en un disco giratorio generalmente apunta a errores de superficie ) End to End también son malos: he tenido algunos discos X25-M G2 de 160 GB que fallan con informes de errores de extremo a extremo grandes (> 1000). Sin embargo, solo hay dos atributos de condición de error útiles presentes para estos discos, ya que la mayoría de los atributos SMART útiles para discos normales no se aplican a los SSD.

Sin embargo, SMART generalmente no se considera 100% confiable. El estudio de Google sobre fallas de disco encontró que si bien había buenas correlaciones entre los diversos indicadores de advertencia temprana SMART y la falla de la unidad, no era una herramienta útil para predecir la falla individual de la unidad. Por esta razón, generalmente uso SMART como una forma de probar que una unidad es mala (si se muestran errores, probablemente fallarán pronto), en lugar de probar que una unidad sigue siendo buena.

— Daniel Lawson
fuente

1

Tenga en cuenta que el estudio de Google se concentró en las indicaciones previas a fallas de SMART, que resultaron ser menos que confiables. Informar sobre las condiciones de falla es algo más preciso.

— Chris S

2

Aunque está hecho para discos duros "tradicionales", la utilidad "badblocks" podría ser de algún beneficio ya que está destinada a ejercer todos los sectores asignables en el disco. Con la prevención de fragmentación de SSD y las reasignaciones internas, no podrá decirle con certeza que el disco es bueno. Sin embargo, si te dice que el disco está mal, seguramente lo tiraría como muerto.

— bot403
fuente

1

HD Tune (y HD Tune Pro ) son excelentes herramientas para medir el estado y el rendimiento de su unidad SSD. La versión gratuita (HD Tune) tiene un conjunto de funciones muy limitado, pero el análisis de salud se incluye en eso, por lo que tuvo suerte. La versión Pro tiene un período de prueba de 15 días que recomiendo probar, le dará un excelente análisis en profundidad sobre el rendimiento de su SSD.

— András Szepesházi
fuente