Nos hace poco tuvimos un pequeño problema con la creación de redes que varios servidores serían intermitentemente perder la conectividad de red de una manera bastante dolorosa-a-determinación (reinicio duro necesario). Esto ha estado sucediendo durante aproximadamente dos semanas, aparentemente al azar, en diferentes servidores. Ningún patrón particular que pudiéramos discernir.
Después de investigar un poco, vimos que el conmutador informaba 100 Mbps para el puerto con problemas:
Esto suena notablemente a lo que sucedió en el artículo de Joel Spolsky Five Whys
Michael pasó un tiempo haciendo una autopsia y descubrió que el problema era un simple problema de configuración en el conmutador. Hay varias velocidades posibles que un interruptor puede usar para comunicarse (10, 100 o 1000 megabits / segundo). Puede establecer la velocidad manualmente, o puede dejar que el interruptor negocie automáticamente la velocidad más alta con la que ambos lados pueden trabajar. El interruptor que falló había sido configurado para autonegociar. Esto generalmente funciona, pero no siempre, y en la mañana del 10 de enero, no funcionó.
Ahora hemos deshabilitado la negociación automática en nuestro hardware de red y lo hemos configurado a una velocidad fija de 1000 Mbps (gigabit).
Mis preguntas a aquellos con más experiencia en redes de hardware de servidor:
- ¿Qué tan comunes son los problemas de negociación automática con el hardware de red moderno?
- ¿Se considera una buena práctica de red estándar deshabilitar la negociación automática y establecer velocidades fijas al configurar la red?