El consenso general parece ser que la respuesta a su pregunta viene en dos partes:
¿Cómo encontramos la fuente del gracioso olor a quemado?
Tienes el "Cómo" bastante bien clavado:
- La "prueba de olfateo"
- Busque humo / neblina visible
- Camina por la habitación con una cámara térmica (IR) para encontrar puntos calientes
- Verifique el monitoreo y los paneles del dispositivo para alertas
Puede mejorar sus posibilidades de encontrar el problema rápidamente de varias maneras: la supervisión mejorada suele ser la más fácil. Algunas preguntas para hacer:
- ¿Recibe temperatura y otras alertas de salud de su equipo?
- ¿Sus sistemas UPS informan fallas a su sistema de monitoreo?
- ¿Recibe alarmas de consumo de corriente de su equipo de distribución de energía?
- ¿Los detectores de humo de la sala informan al sistema de monitoreo? (y pueden ellos? )
¿Cuándo deberíamos solucionar el problema en lugar de presionar el Big Red Switch?
Esta es una pregunta más interesante.
Apretar el gran interruptor rojo puede costarle a su empresa una gran cantidad de dinero a toda prisa: las liberaciones de agentes limpios pueden llegar a las decenas de miles de dólares y los costos de interrupción / recuperación después de un apagado de emergencia (EPO, "dejar la habitación" ) puede ser devastador.
No querrá dejar caer un centro de datos porque un condensador en una fuente de alimentación explotó e hizo que la habitación oliera.
Por el contrario, un incendio en una sala de servidores puede costarle a su empresa sus datos / equipos y, lo que es más importante, la vida de su personal.
La resolución de problemas con "ese olor a quemado divertido" nunca debe tener prioridad sobre la seguridad , por lo que es importante tener algunas reglas claras sobre la resolución de problemas de condiciones "previas al incendio".
Las pautas que siguen son mis limitaciones personales que aplico en ausencia de (o además de) cualquier otro procedimiento / reglas claramente definidos: me han servido bien y pueden ayudarlo, pero podrían matarme o despedido mañana, así que aplíquelos bajo su propio riesgo.
Si ve humo o fuego, abandone la habitación.
Esto debería ser evidente, pero digámoslo de todos modos: si hay un incendio activo (o humo que indica que pronto lo habrá), evacue la habitación, corte la corriente y descargue el fuego. sistema de supresion.
Pueden existir excepciones (ejercer algo de sentido común), pero esta es casi siempre la acción correcta.
Si va a solucionar el problema, siempre tenga al menos otra persona involucrada.
Esto es por dos razones. Primero, no quiere estar deambulando en un centro de datos y, de repente, un estante sube en la fila por la que camina y nadie sabe que está allí. En segundo lugar, la otra persona es su control de la cordura en la resolución de problemas en lugar de abandonar la sala, y si hace la llamada para presionar el Big Red Switch, tiene el beneficio de que una segunda persona esté de acuerdo con la decisión (ayuda a evitar los aspectos que limitan la carrera) de tal decisión si alguien la cuestiona más tarde).
Ejerza medidas de seguridad prudentes al solucionar problemas
Asegúrese de tener siempre una ruta de escape (un extremo abierto de una fila y una ruta despejada hacia una salida).
Mantenga a alguien estacionado en el lanzamiento de EPO / extinción de incendios.
Lleve consigo un extintor de incendios (Halon u otro agente de limpieza, por favor).
Recuerde la regla # 1 arriba.
En caso de duda, salga de la habitación . Tenga cuidado con su respiración: use un respirador o una máscara de oxígeno. Esto podría salvar su salud en caso de incendio químico.
Establezca un límite y manténgalo con
mayor precisión, establezca dos límites:
- Condición ("¿Cuánto peor dejaré que esto se ponga?") Y
- Tiempo ("¿Cuánto tiempo seguiré tratando de encontrar el problema antes de que sea demasiado arriesgado?").
Los límites que establezca también se pueden usar para permitir que su equipo comience un apagado ordenado del área afectada, por lo que cuando extrae energía no está bloqueando un montón de máquinas activas, y su tiempo de recuperación será mucho más corto, pero recuerde que Si el apagado ordenado tarda demasiado, es posible que deba dejar que algunos sistemas se bloqueen en nombre de la seguridad.
Confíe en su instinto
Si le preocupa la seguridad en cualquier momento, cancele la solución de problemas y limpie la habitación.
Puede o no abandonar la habitación basándose en una sensación instintiva, pero es prudente reagruparse fuera de la habitación con seguridad (relativa).
Si no hay peligro inminente, puede elegir traer al departamento de bomberos local antes de tomar medidas drásticas como una EPO o la liberación de un agente limpio. (De todos modos, pueden decirle que lo haga: su mandato es proteger a las personas, luego a la propiedad, pero obviamente son los expertos en el manejo de incendios, ¡así que debe hacer lo que dicen!)
Hemos abordado esto en los comentarios, pero también podría resumirse en una respuesta: @DeerHunter, @Chris, @Sirex y muchos otros contribuyeron a la discusión