El hardware de PC más moderno incluye funciones de temporizador de vigilancia. Puede leer más sobre ellos aquí a través de wikipedia: Watchdog Timers . También de los documentos del kernel de Linux:
extracto: https://www.kernel.org/doc/Documentation/watchdog/watchdog-api.txt
Un temporizador de vigilancia (WDT) es un circuito de hardware que puede restablecer el sistema informático en caso de una falla de software. Probablemente ya lo sabías.
Por lo general, un demonio de espacio de usuario notificará al controlador de vigilancia del kernel a través del archivo de dispositivo especial / dev / watchdog que el espacio de usuario todavía está vivo, a intervalos regulares. Cuando se produce una notificación de este tipo, el controlador generalmente le indicará al perro guardián del hardware que todo está en orden y que el perro guardián debería esperar un momento más para reiniciar el sistema. Si el espacio de usuario falla (error de RAM, error del kernel, lo que sea), las notificaciones dejan de ocurrir y el perro guardián del hardware reiniciará el sistema (provocando un reinicio) después de que se agote el tiempo de espera.
La API de vigilancia de Linux es una construcción bastante ad-hoc y diferentes controladores implementan partes diferentes y, a veces, incompatibles. Este archivo es un intento de documentar el uso existente y permitir que los futuros escritores de controladores lo utilicen como referencia.
Este SO Q&A titulado, ¿Quién está actualizando el watchdog de hardware en Linux? , cubre el enlace entre el kernel de Linux y el temporizador de vigilancia del hardware.
¿Qué pasa con el paquete de vigilancia?
La descripción en el RPM lo deja bastante claro, en mi opinión. El watchdog
daemon puede actuar como un perro guardián de software o puede interactuar con la implementación del hardware.
extracto de la descripción de RPM
El programa de vigilancia se puede usar como un poderoso demonio de vigilancia de software o se puede usar alternativamente con un dispositivo de vigilancia de hardware, como la interfaz del controlador de vigilancia de hardware de IPMI a un controlador de administración de placa base (BMC) residente. watchdog escribe periódicamente en / dev / watchdog; El intervalo entre las escrituras en / dev / watchdog es configurable a través de la configuración en el archivo sysconfig de watchdog.
Este archivo de configuración también se usa para configurar el watchdog para que se use como un watchdog de hardware en lugar de su operación predeterminada de watchdog de software. En cualquier caso, si el dispositivo está abierto pero no está escrito dentro del período de tiempo configurado, la caducidad del temporizador de vigilancia activará el reinicio de la máquina. Cuando funciona como un perro guardián de software, la capacidad de reiniciar dependerá del estado de la máquina y las interrupciones.
Al operar como un perro guardián de hardware, la máquina experimentará un restablecimiento completo (o cualquier acción que se haya configurado para que se realice al vencimiento del temporizador del perro guardián) iniciada por el BMC.