Estoy ejecutando Debian 7.2 en un viejo Macbook Pro de finales de 2006. Tengo conectados dos discos duros Seagate Backup Plus de 4 TB que tengo en un grupo ZFS duplicado. Recientemente, una de las unidades murió y recibí una unidad de reemplazo que estoy tratando de agregar como un nuevo espejo. Sin embargo, no puedo llevarlo a resilver, ya que inevitablemente ocurre un error antes de que pueda terminar.
El problema es que esta unidad de reemplazo aparentemente se sigue desconectando y volviendo a conectar en una fracción de segundo. Lo que he encontrado es que los siguientes mensajes se imprimen en el registro del sistema una y otra vez:
Jan 19 20:08:07 thingamadealies kernel: [100555.410370] usb 1-1: USB disconnect, device number 43
Jan 19 20:08:07 thingamadealies kernel: [100555.660059] usb 1-1: new high-speed USB device number 44 using ehci_hcd
Jan 19 20:08:07 thingamadealies kernel: [100555.794444] usb 1-1: New USB device found, idVendor=0bc2, idProduct=a0a4
Jan 19 20:08:07 thingamadealies kernel: [100555.794452] usb 1-1: New USB device strings: Mfr=2, Product=3, SerialNumber=1
Jan 19 20:08:07 thingamadealies kernel: [100555.794458] usb 1-1: Product: Backup+ Desk Mac
Jan 19 20:08:07 thingamadealies kernel: [100555.794463] usb 1-1: Manufacturer: Seagate
Jan 19 20:08:07 thingamadealies kernel: [100555.794467] usb 1-1: SerialNumber: XXXXXXXX
Jan 19 20:08:07 thingamadealies kernel: [100555.795636] scsi41 : usb-storage 1-1:1.0
Jan 19 20:08:07 thingamadealies mtp-probe: checking bus 1, device 44: "/sys/devices/pci0000:00/0000:00:1d.7/usb1/1-1"
Jan 19 20:10:46 thingamadealies kernel: [100714.601169] usb 1-1: USB disconnect, device number 44
Jan 19 20:10:46 thingamadealies kernel: [100714.872081] usb 1-1: new high-speed USB device number 45 using ehci_hcd
... etc ...
A veces esto sucederá varias veces por minuto. Ocasionalmente, los mensajes se imprimen con unos pocos segundos de diferencia. En otras ocasiones, este comportamiento se detiene por completo durante varias horas, o incluso cerca de un día. Sospecho, pero no tengo pruebas, de que podría estar relacionado con cuando el disco duro está bajo carga.
No se imprimen otros errores USB o IO u otros mensajes relevantes en syslog, y no sé dónde más puedo buscar pistas.
La otra unidad no tiene este problema en absoluto, y ha estado funcionando muy bien desde que la obtuve.
Lo que he probado hasta ahora:
- cambiar qué enchufes USB están conectados los discos, para ver si el otro disco comienza a tener este problema. Hasta ahora no lo ha hecho, pero solo han pasado una o dos horas.
- También busqué en Google bastante, y encontré otras personas con problemas similares, pero ninguno exactamente igual al mío, y todavía no he encontrado una solución. La mayoría de las personas con este problema al menos reciben algún tipo de error USB en syslog junto con el mensaje "Desconexión USB".
¡Cualquier ayuda que alguien pueda darme sería muy apreciada! Realmente no sé cómo depurar un problema de hardware como este.
Actualizar:
Después de cambiar a qué enchufes USB están conectadas las unidades, el mensaje que se envía a syslog cambió a:
usb 1-3: restablezca el dispositivo USB de alta velocidad número 4 usando ehci_hcd
He confirmado que usb 1-3 es el problema de la unidad. Entonces algo sigue mal, pero ahora es algo incorrecto ligeramente diferente. Hasta ahora, ZFS no ha tenido ningún error ... espero que siga así.
Actualización 2:
¡La resistencia ha terminado! Sin embargo, sigo recibiendo los mensajes "restablecer dispositivo USB de alta velocidad". Intenté cambiar los cables entre mis dos unidades, pero no hizo ninguna diferencia, así que creo que eso descarta que el problema sea el cable.
He visto alguna evidencia de que actualizar mi kernel podría solucionar esto, así que voy a intentarlo.
Actualización 3:
Actualicé mi kernel a 3.10, no tuvo efecto. Todavía no sé cómo solucionar esto.
usb 4-1.5: USB disconnect, device number 3
usb 4-1.5: new low-speed USB device number 4 using ehci-pci
usb 4-1.5: New USB device found, idVendor=17ef, idProduct=6019
....