Hoy recibimos un "requisito" interesante de un cliente.
Quieren un 100% de tiempo de actividad con conmutación por error fuera del sitio en una aplicación web. Desde el punto de vista de nuestra aplicación web, esto no es un problema. Fue diseñado para poder escalar en varios servidores de bases de datos, etc.
Sin embargo, debido a un problema de red, parece que no puedo entender cómo hacerlo funcionar.
En pocas palabras, la aplicación vivirá en servidores dentro de la red del cliente. Se accede tanto por personas internas como externas. Quieren que mantengamos una copia del sistema fuera del sitio que, en caso de una falla grave en sus instalaciones, inmediatamente se recuperaría y se haría cargo.
Ahora sabemos que no hay absolutamente ninguna manera de resolverlo para las personas internas (¿paloma mensajera?), Pero quieren que los usuarios externos ni siquiera lo noten.
Francamente, no tengo la menor idea de cómo esto podría ser posible. Parece que si pierden la conectividad a Internet, entonces tendríamos que hacer un cambio de DNS para reenviar el tráfico a las máquinas externas ... Lo que, por supuesto, lleva tiempo.
Ideas?
ACTUALIZAR
Tuve una discusión con el cliente hoy y aclararon sobre el tema.
Se quedaron atrapados en el número 100%, diciendo que la aplicación debería permanecer activa incluso en caso de inundación. Sin embargo, ese requisito solo entra en vigor si lo alojamos para ellos. Dijeron que manejarían el requisito de tiempo de actividad si la aplicación vive completamente en sus servidores. Puedes adivinar mi respuesta.