Vi un comportamiento extraño que cambia el tiempo del sistema en algunos servidores (hardware): en / var / logs / syslog, la fecha y hora que precede a cada mensaje de registro a veces cambia a uno aleatorio y vuelve a la normalidad en el siguiente mensaje, como el siguiente:
22 de febrero de 2018 09:09:30 ... 22 de febrero de 2018 09:09:32 ... 13 de enero 2610 15:37:42 ... 22 de febrero de 2018 09:09:33 ... 22 de febrero de 2018 09:09:34 ...
Como en el ejemplo, el cambio repentino de fecha y hora puede estar a cientos de años de distancia.
Puedo confirmar que los mensajes de registro que tienen marcas de tiempo extrañas no provienen de ningún proceso específico, solo pueden suceder aleatoriamente para cada uno.
Y la duración entre 2 cambios de tiempo anormales varía entre unos minutos y unas pocas horas (sin embargo, sospecho que los cambios de tiempo anormales podrían ocurrir con mayor frecuencia, pero muchos de ellos no se revelan en el registro del sistema, ya que no está escribiendo registros por segundo).
Además, dado que ocurre en más de un servidor, supongo que no es un problema de hardware.
Más información sobre los servidores: son una instalación de taladro abierto con un controlador y algunos nodos de cómputo. Cada servidor tiene un servicio ntp ejecutándose. El controlador está configurado para tomar tiempo de su propio reloj de hardware, y los servidores de nodo de cómputo sincronizan el tiempo del controlador. Tenga en cuenta que cada servidor tiene cambios de hora anormales a su propio ritmo; parece que el "momento incorrecto" no está sincronizado desde el controlador a través de ntp.
Sospechaba que los sistemas invitados (máquinas virtuales) en los nodos de cómputo podrían afectar la hora de su sistema host. Pero esto no puede explicar por qué el controlador tiene el mismo problema mientras no ejecuta ninguna máquina virtual.
Necesito un método para detectar: ¿quién cambió la hora del sistema y cómo sucede?
hwclock
bucle? Algo como:while true; do hwclock; sleep 5; done