Tengo 15 servidores Linux RH 4.7 idénticos de 64 bits. Ejecutan la base de datos del clúster (el clúster es el nivel de aplicación). En ocasiones (cada mes más o menos) se congela un cuadro aleatorio (nunca el mismo).
Puedo hacer ping a la caja y hacer ping funciona. Si trato de ssh en el cuadro me sale:
ssh_exchange_identification: Connection closed by remote host
SSH está configurado correctamente.
Cuando voy a la sala de servidores e intento iniciar sesión directamente en la consola, puedo cambiar de consola con Alt+ Fn, puedo ingresar un nombre de usuario y los caracteres se muestran, pero después de presionar Enter, no sucede nada. Esperé 8 horas una vez y no cambió.
Configuré syslog para registrar todo en un host remoto, y no hay nada en esos registros. Cuando reinicio la máquina, funciona sin problemas. He ejecutado pruebas HW: todo está bien y no hay nada en los registros. Las máquinas también se controlan con NAGIOS, y no hay una carga o actividad inusual antes de la congelación.
Me he quedado sin ideas; ¿Qué más puedo hacer o consultar?