Me enfrento a un problema muy molesto que noté dentro de una semana y para el que no puedo encontrar una respuesta: mi red de repente deja de responder, generalmente regresa exactamente 25 segundos después. Estaba usando el kernel 3.10.4 y ahora migré a 3.11-rc4 para ver si algo cambió, pero no, el comportamiento es el mismo. Y dado que es un problema difícil de detectar debido al hecho de que la navegación web habitual está en "ráfagas" y la interrupción es completamente aleatoria, realmente no puedo decir que este problema también estaba presente en un kernel anterior (siempre uso personalizado pero kernels sin parche de kernel.org, todos compilados por mí mismo)
No puedo decirle al núcleo es el culpable tampoco, pero puedo decir que no hay pistas sobre los registros del sistema (he comprobado tanto /var/log/syslog
y /var/log/messages
y no hay nada inusual allí) y que el hardware no parece la culpa, para los espectáculos de problemas usando cualquiera de mis tarjetas de red:
lspci output:
02:00.0 Ethernet controller: Broadcom Corporation NetXtreme BCM5751 Gigabit Ethernet PCI Express (rev 01)
04:00.0 Ethernet controller: 3Com Corporation 3c905B 100BaseTX [Cyclone] (rev 30)
y ya intenté intercambiar los puertos del conmutador de ethernet y todavía nadie más en el que trabajo tiene un problema excepto yo (aunque usamos máquinas similares, soy el único que usa Linux, así que tuve que tomar algunas bromas infames al respecto bueno ... jeje).
Subí a Wirehark en mi máquina y la dejé haciendo ping continuamente a nuestra puerta de enlace y a otra máquina en el mismo segmento de red. Luego, a la primera señal de mal funcionamiento de la red, lo verificaba y verificaba que la puerta de enlace dejara de responder pings, pero la otra máquina todavía estaba allí respondiendo normalmente. En otras ocasiones, la otra máquina deja de responder y la puerta de enlace está bien, y otras veces ambos dejan de responder. No sé qué más hacer, por lo que me gustaría obtener ayuda o consejos sobre cómo depurar esto, ya que los registros del sistema son completamente normales.
Tengo mi archivo de configuración del kernel y un archivo de captura de wireshark que muestra la situación. Puedo publicar aquí o en algún sitio de pastebin en caso de que a alguien le resulte útil entender el caso, solo háganme saber el nivel de detalle que debo usar (supongo que el nivel de paquete sin los datos en bruto sería suficiente).