He estado haciendo actualizaciones de firmware en los conmutadores HP. Se han actualizado dos modelos diferentes:
- ProCurve Switch 5406zl Intelligent Edge (J8697A): actualizado de K.15.06.0008 a K.15.12.0012
- Conmutador HP 2520-24G-PoE (J9299A): actualizado de J.14.54 a J.15.09.0021
Comprobando cada interruptor justo después de iniciar la nueva imagen, he observado algo:
- Los conmutadores cargaron la nueva imagen de firmware sin errores y la conectividad se recuperó tan pronto como se inició el conmutador. En este punto, el uso de CPU era bajo (menos del 10%)
- Pocos segundos después, el uso de la CPU aumentó hasta el 100% y permaneció allí durante varios minutos. No pude detectar ningún problema en este punto, aparte de que la CLI a través de SSH es un poco lenta: conectividad normal, sin mensajes de registro ...
- Después de cinco a diez minutos al 100%, la CPU volvió a la normalidad sin ningún cambio de mi parte.
Ambos modelos estaban teniendo este comportamiento. Retrocedí una unidad de cada modelo a la imagen de firmware anterior y se comportaron de la misma manera.
A pesar de que este pico de CPU justo después del arranque no causó ningún problema, me pregunto si el comportamiento normal de la red podría ser la causa de este pico, pero no lo creo. He considerado los siguientes aspectos:
Justo después del inicio, STP comienza a ejecutarse, genera BPDU y cicla todos los puertos en el conmutador a través de los estados Bloqueo, Escucha, Aprendizaje y Reenvío. Sin embargo, incluso con 802.1D, este proceso no lleva más de 1 minuto con temporizadores predeterminados. Además, estaba comprobando los conmutadores a través de SSH, por lo que todos los cálculos de STP ya estaban hechos cuando pude conectarme al conmutador.
Justo después del arranque, la tabla de direcciones MAC está vacía y se necesita difusión para que se reenvíen los primeros cuadros. Pero dudo que esta transmisión tome 100% de CPU, mucho menos durante 5 minutos, en un conmutador de 24 puertos.
Todos los conmutadores actúan como dispositivos L2, no se habilita la funcionalidad L3, por lo que descarto el enrutamiento y otros procesos L3.
¿Me estoy perdiendo algo "normal" en las operaciones de red que puede explicar este uso de la CPU durante 5 minutos después del reinicio mientras se mantiene la conectividad? ¿Tal vez es algún tipo de proceso en segundo plano que el conmutador se ejecuta justo después de reiniciar?