Si tuviera una tarea que quisiera ejecutar solo una vez en un grupo de servidores, a intervalos regulares, ¿cuál sería la mejor manera de lograrlo? La definición de clúster en este caso es 2 o más servidores idénticos con sesiones distribuidas ubicadas detrás de un equilibrador de carga.
Caso de uso: tiene una tarea costosa de ejecutar que solo debe ejecutarse una vez por X horas. Este trabajo podría, por ejemplo, iterar sobre un montón de registros y actualizar su estado.
- El peor de los casos es que tener el trabajo ejecutado dos veces invalida sus datos.
- El mejor de los casos es que el trabajo utiliza recursos en todos sus servidores.
Resumen de requisitos:
- El trabajo aún debe ejecutarse incluso si uno de los nodos está inactivo.
- El trabajo solo debe ejecutarse una vez por programa.
- Si se programan varios trabajos al mismo tiempo o en momentos superpuestos, el número de trabajos en ejecución se distribuye equitativamente entre los servidores.
- Las máquinas deben tener la misma base de código y estar sincronizadas a través de NTP.
- La configuración puede diferir entre nodo y nodo, según las variables de entorno.
- El trabajo debe comenzar a tiempo o dentro de un intervalo dado del tiempo asignado. (por ejemplo, 5 minutos)
Soluciones posibles
- Establezca un nodo como el nodo maestro, esto no funciona ya que viola 1 anterior.
- Solicite que el equilibrador de carga se equilibre para iniciar el trabajo. Desafortunadamente, esto tiene el efecto secundario de que si tiene varios trabajos ejecutándose al mismo tiempo, todos pueden ejecutarse en la misma máquina.
Esto debería ejecutarse en Java, en un contenedor de servlet. Sin embargo, no está codificando los trabajos que estoy buscando.
Seguramente este es un problema resuelto con la mejor solución conocida.
Pregunta relacionada /programming/5949038/schedule-job-executes-twice-on-cluster
Esto no es un duplicado ya que la solución es insuficiente según los 5 requisitos dados anteriormente. La solución más votada sufre de un problema racial, y la segunda solución viola el requisito 3