Estoy trabajando en un proyecto que utiliza Raspberry Pis que se implementará en varios lugares. Tienen un hardware especial conectado para fines de automatización y ejecutan un servicio web (que escribí) para acceder al hardware. Ocasionalmente, implementaremos un nuevo software en el método Pis, aún por determinar, y esta es un gran área de preocupación.
Mi pregunta: ¿Puede nombrar algunas ideas o mejores prácticas para mitigar la necesidad de intervención manual en caso de problemas? Me pregunto si hay algún tipo de solución de vigilancia mediante la cual el Pi se reinicia normalmente en caso de un bloqueo (¿tal vez incapacidad para llamar a casa?), Y si aún no funciona, se reinicia en una partición a prueba de fallas que puede "llamar a casa" para obtener una solución (ya sea reimagen o reiniciar normalmente si solo hubo una interrupción de la red).
Realmente no estoy seguro de qué es exactamente lo que estoy buscando, solo formas que nos evitarán tener que llamar o enviar personas para que realicen reinicios o reimpresiones manuales. Un esquema de partición dual parece que puede ser útil, pero tal vez haya mejores ideas.