Mejores prácticas de firmware y programas de actualización


12

El firmware recibe muy poca atención cuando se trata de actualizaciones. Fuera de la vista, fuera de la mente.

Muchos dispositivos: controladores RAID, NIC, conjuntos de chips e incluso discos duros obtienen algunos beneficios de la actualización. Mejores características, seguridad / corrección de errores, etc.

La mayoría de las SA dicen: "Siempre que se rompa, actualice el firmware". Pero esto puede conducir a dificultades en el futuro; Varias veces, cuando me comunico con Dell por un disco duro defectuoso, me preguntan si el firmware de mi disco duro está actualizado. Todos mis servidores usan algún tipo de configuración RAID. Si ya tengo una falla en una sola unidad, ¿debería considerar intentar actualizar el firmware en el resto de las unidades o en el controlador RAID? Yo diría que no. Pero Dell parece tener una visión diferente.

  • ¿Qué es un calendario de actualización realista para el firmware del sistema?
  • ¿Tienes alguna práctica recomendada para compartir?

(Soy consciente de que Dell tiene una buena utilidad llamada Server Update Utility , que comprueba todos los firmware nuevos en cualquier servidor Dell).

Respuestas:


10

Actualizo el firmware en dos instancias clave.

  1. Al organizar un servidor.
    • Cuando acabo de obtener el servidor, comprobaré en el sitio web de HP la fecha de su último "CD de actualización de firmware". Si es lo suficientemente nuevo, lo ejecutaré en el servidor antes de ponerlo en producción.
    • Cuando reutilizo un servidor. Por lo general, este servidor tiene entre 2 y 5 años y probablemente no haya tenido una actualización de firmware en todo ese tiempo. Como lo estoy formateando de todos modos, actualizaré todos los diversos firmware en el servidor.
  2. Cuando hay un proveedor identificado, debe hacerlo.
    • A veces se identifican problemas importantes de estabilidad, como la incapacidad de reconstruir una matriz RAID5 después del tipo incorrecto de falla, o un error de rendimiento importante en el motor de descarga TCP en la NIC.
    • A veces, al solicitar asistencia, el técnico de asistencia me solicitará que actualice el firmware. Lo haré entonces.

Hay una tercera instancia que no mencioné anteriormente, porque aún no ha sucedido:

  • Al poner un componente mucho más nuevo en un servidor anterior. A veces, el BIOS del sistema necesitará una actualización para manejarlo.

Creo que eso logra un excelente equilibrio.
Joseph Kern

5

Usamos HP SIM (System's Insight Manager) para implementar el firmware, lo hacemos por plataforma: primero prueba, luego desarrollo, luego integración, luego referencia y finalmente producción, generalmente alrededor de una semana por plataforma, por lo que tenemos un 5/6 semana de lanzamiento a la ventana de producción. Parece que funciona, pero una cosa que NUNCA hacemos es implementar el firmware al mismo tiempo que otras actualizaciones como controladores / código, etc., ahorra mucho señalar con el dedo.


+1, señalar con el dedo, un hecho muy común ... parece que todos los martes ...
Joseph Kern

4

Podría ir contra la corriente aquí, pero si no está roto, no lo arregles. Si no es un problema de seguridad, lo dejo solo.

Nunca he tenido a Dell denegar el servicio por ese motivo.

¿Quizás pueda programar la utilidad una vez al mes y luego actualizarla con otros reinicios?


+1 por decir la verdad. SI no hay una buena razón para actualizar (como el proveedor ya no admite su kit a menos que actualice el BIOS / firmware), ¿por qué lo está haciendo?
RainyRat

No trabajo con el servicio de asistencia de Dell, pero sigo atrapado en un problema que Intel no admitirá hasta que actualice mi BIOS, solo que no puedo hacer que se actualice y a veces me pregunto si es porque es el único disponible. la actualización es demasiadas versiones antes de lo que mi servidor está ejecutando.
Ben Dunlap

1
En principio, estoy de acuerdo con usted, pero tenemos algunos servidores que son significativamente más rápidos y más estables ahora que cuando se compran, simplemente debido a las mejoras de firmware.
Chopper3

Convenido. Supongo que los problemas de rendimiento podrían considerarse "rotos" en este caso.
MathewC

Para el registro, recientemente hice que Dell negara un reemplazo del disco duro en un servidor PowerEdge hasta que actualicé el firmware del controlador RAID a la última versión.
Ryan Bolger

4

Debe tratar las actualizaciones de firmware como trata los parches , aunque estas actualizaciones suelen ser más difíciles de implementar, por lo que es posible que desee consultar las notas de la versión para ayudar a decidir si vale la pena el esfuerzo (pero, de nuevo, es posible que también esté haciendo esto para los parches) ) Las actualizaciones de firmware tienen la misma probabilidad de contener un nuevo error desagradable que corregirlo.

La actualización del firmware debe realizarse al poner en marcha (o volver a poner en marcha el hardware), ya que es un momento fácil para hacerlo.

El despliegue debería seguir más o menos algo en este sentido:

  1. Prueba en máquinas de laboratorio.
  2. Implementar en sistemas sin importancia
  3. Espere
  4. Implementar en sistemas importantes / de producción

Por otra parte, algunas cosas no pueden seguir esto. En particular, es bastante crucial enviar rápidamente los parches de Microsoft a los escritorios de Windows, y las pruebas son difíciles de realizar rápidamente sin recursos significativos.


2

Por lo general, actualizaré el firmware cuando comisione cualquier equipo de infraestructura nuevo. Las estaciones de trabajo y las impresoras solo se actualizan si hay un problema específico, como una corrección de errores requerida o un problema de seguridad. Es menos importante con los servidores, ya que, en su mayor parte, el código del firmware no se ejecuta más allá del proceso de arranque o es tan simple que no hay muchos errores.

He tenido malas experiencias con la actualización del firmware RAID en los servidores, ya que muchos fabricantes no garantizan que la configuración RAID actual sea viable si cambia la versión del firmware, lo mismo con los discos individuales en la matriz.

Mi tendencia sería aplicar una política de "si no está roto, no lo arregles" en su mayor parte. Vale la pena verificar si es posible recuperarse de una mala actualización de Firemware (es decir, ROM redundante en servidores HP, o si tiene un flasheador EEPROM y está dispuesto a usarlo como un chip extraíble).


¿Con qué frecuencia verifica si hay "problemas de seguridad" en todos sus diferentes firmware?
Joseph Kern

Prácticamente todo nuestro kit es HP. Al registrar el producto, registro una cuenta genérica para "notificaciones sobre problemas de firmware, controladores y seguridad". Si me voy, redirigiré esa cuenta a mi sucesor.
Richard Slater

2

No puedo hablar sobre Dell, pero la gente del grupo de almacenamiento de IBM me dijo hace muchos años que los primeros niveles de su firmware RAID NUNCA tienen el mejor rendimiento. Primero buscan estabilidad y luego aumentan el rendimiento con futuros niveles de revoluciones. Desafortunadamente, pocos de nosotros pensaríamos (o tal vez tener el moxie) para volver más tarde y meterse con el firmware RAID de un sistema saludable a menos que haya problemas. Por lo tanto, nuestra estrategia ha sido actualizar los niveles de firmware RAID cada vez que configuramos un nuevo servidor, suponiendo que el adaptador RAID no sea un modelo completamente nuevo. De esa forma, al menos obtenemos los mejores niveles de rendimiento disponibles en ese momento. Si se trata de un nuevo adaptador de modo, intentamos hacer una nota mental para regresar en unos meses y buscar actualizaciones, pero no somos religiosos al respecto.

En las placas base, NO nos metemos con ellas a menos que el soporte técnico del proveedor nos lo indique. Nuestra experiencia a lo largo de los años ha sido que, a menos que haya un problema específico que deba solucionarse, los riesgos superan ampliamente los beneficios difíciles de medir.

// spk


1

He utilizado SUU y productos similares de HP e IBM con éxito. Los únicos problemas que he encontrado fueron cuando se utilizó un controlador de proveedor para reemplazar un controlador de Dell, sin ninguna razón técnica, lo que provocó que la actualización SUU fallara la actualización OM en un servidor Dell. Realizamos actualizaciones para firmware y controladores en varios cientos de servidores al menos dos veces al año para mantenerlos actualizados. Nunca tuvimos problemas con el firmware RAID.


Cuéntame más ...
Joseph Kern

Seguimos los lanzamientos de Dell, creo que trimestralmente, para programar los cambios para aplicar las actualizaciones. Los aplicaríamos a todas las máquinas Dell en todos los clientes que admitimos. Quizás tuvimos suerte, pero al haber tenido muy pocos problemas, creo que también se redujo a tener un plan y mantener las cosas actualizadas. Cuando adquirimos nuevos servidores, una de las primeras cosas que hicimos fue llevar todos los productos al nivel actual.
Mitch

1

Actualizamos el firmware cada vez que tenemos, lo que lamentablemente es probablemente 3-4 veces por año (ventanas de mantenimiento principales) para algunos sistemas.


0

Si lee la propaganda que acompaña a una actualización de firmware de Dell, encontrará que clasifica la actualización como crítica, importante o lo que sea, y describe lo que corrige la actualización (¡no siempre tan claramente como uno desearía!).

Mi opinión es que no aplicaré una actualización de firmware sin una muy buena razón. Si es una actualización crítica y soluciona un problema que tengo una posibilidad razonable de encontrar, entonces sí, lo aplicaré aunque sea un negocio estresante.

Como usted dice, el soporte de Dell normalmente insiste en aplicar cualquier actualización relevante antes de que lo apoyen, y obviamente en ese caso no tiene muchas opciones. Puede comprender que Dell no desea perder el tiempo del ingeniero, a pesar de que nunca he sabido que el firmware sea la causa de una llamada de soporte.

JR


0

Creo que depende del tipo de entorno con el que tengas que lidiar. Si trabaja en un entorno que requiere alta disponibilidad y no puede reiniciar los servidores cuando lo desee. La mejor práctica en mi opinión es implementar un programa de mantenimiento. Seleccione un período de tiempo para cada sistema, notifique a los usuarios y realice todo el trabajo necesario, incluidas las actualizaciones de firmware, durante este período de tiempo asignado. De esta forma, puede estar seguro de que todos sus sistemas están actualizados y minimizar el impacto en la producción al mismo tiempo. Además, como se señaló en los comentarios anteriores, es necesario verificar las actualizaciones de firmware al crear un nuevo servidor.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.