Uno de nuestros servidores Linux (CentOS) fue inalcanzable anoche.
No se pudo acceder al servidor de ninguna manera, excepto para la consola remota. Después de iniciar sesión con la consola remota, resultó que tampoco podía hacer ping a ningún host externo.
A simple service network restart
resolvió el problema, pero todavía me pregunto qué pudo haber causado esto. Mis archivos de registro parecen indicar que no hay ningún error (a excepción de los diversos demonios que necesitan una conexión de red y fallaron después de la falla de la red).
¿Hay algún paso adicional que pueda tomar para averiguar la causa de este problema?
EDITAR : esto acaba de suceder nuevamente. El servidor no respondió por completo hasta que emití un reinicio del servicio de red. Cualquier consejo es bienvenido. ¿Podría esto ser causado por un componente de hardware defectuoso?
Según la solicitud de Madhatters, aquí hay algunos extractos del registro en ese momento (la red se bloqueó a las 20:13):
/ var / log / messages:
Dec 2 20:01:05 graviton kernel: Firewall: *TCP_IN Blocked* IN=eth0 OUT= MAC=<stripped> SRC=<stripped> DST=<stripped> LEN=40 TOS=0x00 PREC=0x00 TTL=101 ID=256 PROTO=TCP SPT=6000 DPT=3306 WINDOW=16384 RES=0x00 SYN URGP=0
Dec 2 20:01:05 graviton kernel: Firewall: *TCP_IN Blocked* IN=eth0 OUT= MAC=<stripped> SRC=<stripped> DST=<stripped> LEN=40 TOS=0x00 PREC=0x00 TTL=100 ID=256 PROTO=TCP SPT=6000 DPT=3306 WINDOW=16384 RES=0x00 SYN URGP=0
Dec 2 20:01:05 graviton kernel: Firewall: *TCP_IN Blocked* IN=eth0 OUT= MAC=<stripped> SRC=<stripped> DST=<stripped> LEN=40 TOS=0x00 PREC=0x00 TTL=101 ID=256 PROTO=TCP SPT=6000 DPT=3306 WINDOW=16384 RES=0x00 SYN URGP=0
Dec 2 20:13:34 graviton junglediskserver: Connection to gateway failed: xGatewayTransport - Connection to gateway failed.
Los primeros tres mensajes son respuestas simples a las reglas de iptables que configuré a través del firewall LFD. El último mensaje indica que JungleDisk, que uso para las copias de seguridad, ya no puede conectarse a la puerta de enlace. Aparte de esto, no hay mensajes interesantes en este momento.
EDIT 4 dic: según la solicitud de Mattdm, aquí está la salida de ethtool eth0
:
(Por favor, no es que estas son las configuraciones que funcionan actualmente . Si las cosas vuelven a fallar, me aseguraré de publicar esto nuevamente si es necesario.
Settings for eth0:
Supported ports: [ TP ]
Supported link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Supports auto-negotiation: Yes
Advertised link modes: 10baseT/Half 10baseT/Full
100baseT/Half 100baseT/Full
1000baseT/Full
Advertised auto-negotiation: Yes
Speed: 1000Mb/s
Duplex: Full
Port: Twisted Pair
PHYAD: 1
Transceiver: internal
Auto-negotiation: on
Supports Wake-on: g
Wake-on: d
Link detected: yes
Según la solicitud de Joris, aquí también está la salida de route -n
:
aron@graviton [~]# route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
xx.xx.xx.58 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.42 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.43 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.41 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.46 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.47 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.44 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.45 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.50 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.51 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.48 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.49 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.54 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.52 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.53 0.0.0.0 255.255.255.255 UH 0 0 0 eth0
xx.xx.xx.0 0.0.0.0 255.255.255.192 U 0 0 0 eth0
xx.xx.xx.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
169.254.0.0 0.0.0.0 255.255.0.0 U 0 0 0 eth0
0.0.0.0 xx.xx.xx.62 0.0.0.0 UG 0 0 0 eth0
La parte inferior xx.62 es mi puerta de enlace.
EDITAR 28 de diciembre: el problema volvió a ocurrir y tuve la oportunidad de comparar algunos de los resultados de las pruebas anteriores. Lo que descubrí es que arp -an
devuelve una dirección MAC incompleta para mi puerta de enlace (que no está bajo mi control; el servidor está en un rack compartido):
Durante el fracaso:
? (xx.xx.xx.62) at <incomplete> on eth0
Después service network restart
:
? (xx.xx.xx.62) at 00:00:0C:9F:F0:30 [ether] on eth0
¿Es algo que puedo solucionar o es hora de que me comunique con el centro de datos?