Tengo un servidor Dell 1U con Intel (R) Xeon (R) CPU L5420 @ 2.50GHz, 8 núcleos con Ubuntu Server Kernel versión 3.13.0-32-generic en x86_64. Tiene dos tarjetas de red 1000baseT. Lo tengo configurado para reenviar paquetes de eth0 a eth1.
He notado que en mi archivo kern.log sigue colgando y luego descansando. Esto está sucediendo a menudo. Esto sucede cada pocos segundos, entonces tal vez estará bien durante unos minutos y luego volver a cada pocos segundos.
Aquí está el volcado del archivo de registro:
[118943.768245] e1000e 0000:00:19.0 eth0: Detected Hardware Unit Hang:
[118943.768245] TDH <45>
[118943.768245] TDT <50>
[118943.768245] next_to_use <50>
[118943.768245] next_to_clean <43>
[118943.768245] buffer_info[next_to_clean]:
[118943.768245] time_stamp <101c48d04>
[118943.768245] next_to_watch <45>
[118943.768245] jiffies <101c4970f>
[118943.768245] next_to_watch.status <0>
[118943.768245] MAC Status <80283>
[118943.768245] PHY Status <792d>
[118943.768245] PHY 1000BASE-T Status <7800>
[118943.768245] PHY Extended Status <3000>
[118943.768245] PCI Status <10>
[118944.780015] e1000e 0000:00:19.0 eth0: Reset adapter unexpectedly
Aquí está la información de ethtool:
Configuraciones:
Settings for eth0:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Supported pause frame use: No
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Advertised pause frame use: No
Advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
MDI-X: off (auto)
Supports Wake-on: pumbg
Wake-on: g
Current message level: 0x00000007 (7)
drv probe link
Link detected: yes
Información del conductor:
ethtool -i eth0
driver: e1000e
version: 2.3.2-k
firmware-version: 1.4-0
bus-info: 0000:00:19.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: yes
supports-priv-flags: no
¿Qué podría estar causando esto? ¿Es esto solo un error en el software o un problema real de hardware? He visto a muchos otros tener problemas similares pero no hay una solución real y esto también me lleva a creer que es un problema de software.
¿Quizás alguien pueda arrojar algo de luz sobre esto por mí?