¿Cuál es el mejor momento para programar actualizaciones periódicas en el servidor de producción interno?


9

Dado que un servidor interno se ejecuta en modo de producción, me gustaría mantener el impacto en los usuarios lo más bajo posible al implementar actualizaciones regulares (en el servidor en sí, no en las máquinas de los usuarios ... pero eso sería un problema bastante similar).

La respuesta obvia a mi pregunta es "por la noche, cuando los usuarios están en casa". Pero "noche" es un largo período de tiempo. ¿Debería comenzar temprano en la noche para detectar problemas con la actualización desde el principio y estar listo para retroceder? ¿O es mejor comenzar temprano en la mañana y usar a los primeros usuarios como "conejillos de indias" para desencadenar los problemas más rápidamente? ¿O en el medio de la noche, cuando la concentración de la persona que supervisa la actualización es bastante baja, pero se garantiza que no tendrá identificadores de archivos abiertos de algunos usuarios que trabajan tarde?

¿Hay trabajos de investigación sobre el tema?

Respuestas:


5

¿Por qué no mirar el uso concurrente de su sistema históricamente y determinar qué horas del día el uso es más bajo? Luego pegue su cambio justo en el medio de ese período de bajo uso.

Cuando calcule cuánto tiempo llevará el cambio, incluya pruebas de implementación previas / posteriores y pruebas de verificación de producción. Además, calcule cuánto tiempo tardará el cambio en revertirse si falla alguna prueba.

En mi humilde opinión, sus "primeros usuarios" no deberían ser conejillos de indias. Tener usuarios en vivo, básicamente, la verificación de producción prueba tus cambios no es algo bueno. Destruye la confianza de los usuarios finales y los resultados inesperados pueden estropear la producción, lo que significa que no solo tiene que revertir el cambio, sino también deshacer cualquier 'daño' que el cambio pueda haber causado.

No conozco ningún trabajo de investigación, pero eche un vistazo a cualquier marco de administración de servicios de TI (ITSM) como ITIL, encontrará muchos estándares y mejores prácticas en la administración de versiones de software. Todos los sistemas son diferentes, por lo que depende la cantidad de prácticas que adopte y la formalidad. Los estándares ITSM tienen grandes sistemas en mente.


los estándares y las mejores prácticas no se caen de la nada, por eso me interesó la investigación "original". pero gracias de cualquier manera.
akira

Sí, me doy cuenta de que los estándares no se materializan de la nada; declarando mi ignorancia en los trabajos de investigación en el área.
Nick Kavadias

5

Esto depende completamente de la naturaleza del negocio. Algunas oficinas son de 9 a 5 cinco días a la semana. Otros negocios son las 24 horas del día, los 365 días del año. Otros factores, como la disponibilidad de personal y recursos, juegan un papel importante. Ningún trabajo de investigación podría abarcar de manera exhaustiva todos los horarios o eventualidades posibles.

En última instancia, la administración de la empresa o departamento en conjunto con la administración de TI debe determinar qué es lo mejor.

La clave del éxito es comunicarse con los usuarios cuando el tiempo de inactividad está programado para comenzar, cuánto tiempo se espera que dure, cualquier preparación requerida por los usuarios y lo que pueden esperar como resultado del éxito o el fracaso. Una gran parte de eso es cumplir con las expectativas que establezca.

Al final, nada está grabado en piedra. Si el proceso no funciona, realice ajustes. Su flexibilidad y adaptabilidad serán apreciadas.

Al realizar los procedimientos de mantenimiento y actualización de los equipos de prueba de antemano cuando sea posible, estará mejor preparado cuando llegue el momento de implementarlos en los sistemas de producción.


williamson: investigación: se podría medir la cantidad de administradores generales que realizan sus actualizaciones a qué hora del día y si experimentan más errores en la mañana o en la noche. incluso si cierto administrador tiene que actuar de la manera en que lo hace en un momento dado para que coincida con las circunstancias de la empresa: si la investigación muestra que está en la zona horaria de "error", entonces tal vez pueda cambiar un poco las cosas. Tenía curiosidad por saber cuando las personas realmente hacen sus actualizaciones, las 2 primeras respuestas recogidas exactamente la 'noche' y 'mañana' :)
Akira

1
Comience al comienzo de la ventana de interrupción negociada. Eso te da más tiempo para arreglar algo que sale mal.
mfinni 01 de

para ser justos, es el tipo de cosas 'en su mayoría de sentido común' que comúnmente olvidamos mencionar.
mfinni 01 de

3

Trabajo en un ISP y, según mi experiencia, la mayoría de las personas a las que consideraría administradores de sistemas de gran impacto eligen los viernes por la noche los fines de semana de vacaciones para realizar las principales revisiones de su red. Eso les da 24 horas adicionales para probar y, si es necesario, revertir sus cambios. Sin embargo, en gran medida esto depende completamente de la naturaleza y los hábitos de sus usuarios.


1
Hicimos lo mismo cuando trabajaba en una universidad: las vacaciones también significaban que era menos probable que las personas estuvieran cerca, pero dependiendo del tipo de negocio, podría tener un efecto contrario.
Joe H.

sí, pero aquí apunto a las actualizaciones "diarias". si la ventana inactiva es de 48 horas ... entonces es realmente la opción obvia.
akira

@akira: nadie en su sano juicio actualiza diariamente
Zypher

2

Instalamos actualizaciones a las 9 p.m., lo suficientemente tarde como para que la mayoría de las personas no estén encendidas, lo suficientemente temprano como para pasar toda la noche si es necesario.


2

En mi caso, instalamos actualizaciones a las 4 de la mañana, para evitar el impacto en los usuarios, incluso aquellos que trabajan un poco tarde.

Si tiene un buen sistema de monitoreo que le advierte si ocurre un problema, debería poder solucionarlo temprano en la mañana, incluso antes de ir a trabajar.


1

Realmente depende de la naturaleza de su negocio, pero personalmente prefiero el miércoles por la noche después de las 5 PM. Nunca querrás hacer esto los viernes por la noche ya que si algo sale mal, estarías trabajando durante el fin de semana. Hacer esto el miércoles te dará jueves y viernes para solucionar los problemas, si los hay.

Otro factor importante es programar ventanas de gestión de cambios. Es fundamental que las personas sepan que está ejecutando el mantenimiento: que los servicios pueden verse interrumpidos o no estar disponibles durante ese período. Le permitirá trabajar con confianza, en lugar de preocuparse de que los usuarios se quejen de la caída de los servicios. Su gerencia necesita aprobar las ventanas de cambio, por supuesto.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.