El informe del estado de devops de 2017 dice que hay un 31-45% de "tasa de falla de cambio". Si bien eso suena intuitivamente correcto, ¿se los rastrea como incidentes? Nah Porque se arreglan bastante rápido, generalmente durante la validación.
Un problema que se soluciona rápidamente sigue siendo un problema. Si no está informando esto como tal, eso es un problema.
Por lo tanto, se necesita disciplina para informar las tasas de falla con precisión. Estamos desincentivados para informar así porque queremos que las cosas funcionen y hacemos lo que sea necesario para que esto suceda.
Si su objetivo es que las cosas funcionen, entonces debe ser honesto acerca de las fallas para poder prevenirlas en el futuro. Parece que el equipo aquí está mintiendo (tal vez a sí mismos, ciertamente a la gerencia) sobre fallas porque su objetivo es que las cosas parezcan estar funcionando.
Estas son cosas diferentes. Por ejemplo, tome el viejo chiste de que QA produce errores: "mi código estuvo bien hasta que QA lo descubrió y luego hicieron todos estos errores". Los errores estuvieron allí todo el tiempo, pero el desarrollador los ignoró. El objetivo de un equipo de operaciones debe ser la confiabilidad real , y su administración debe incentivarlos como tales. Eso significa que si implementan más monitoreo que conduzca al descubrimiento de nuevos problemas, deberían ser recompensados, no penalizados por la posterior caída en las métricas de confiabilidad.
TL; DR, ¿cómo demuestra que los devops, específicamente la automatización de implementación, mejoran las tasas de falla de cambio?
Si está tratando de motivar el cambio en su organización, entonces no debería intentar probar nada, sino proporcionar evidencia de lo que otras organizaciones dicen sobre sus propias transiciones. Si está tratando de medir los procesos que ya tiene implementados y justificar su existencia continua, entonces debe estar siguiendo las métricas de confiabilidad estándar, como el tiempo medio de reparación (MTTR).
Pero los principios de DevOps no se tratan simplemente de aumentar la fiabilidad. Incluso la ingeniería de confiabilidad del sitio no se trata simplemente de aumentar la confiabilidad. Por el contrario, desea alcanzar un nivel adecuado de confiabilidad, algo que beneficie al negocio pero que no obstaculice el desarrollo. Y eso plantea el verdadero motivador en devops, que es potenciar el cambio . Desea permitir que la empresa responda más rápido a los estímulos del mercado, lo que ocurre al disminuir la fricción del desarrollador, aumentar la tasa de despliegues, automatizar procesos manuales, etc., mientras se mantiene dentro de un límite aceptable de confiabilidad. Esto significa que necesita medir la confiabilidad, pero también necesita medir la velocidad, porque su objetivo es aumentar la última mientras mantiene la primera relativamente estática.