Solo conozco directamente un problema con BFD, que es la demanda de CPU. Actualmente estoy investigando un problema con un Cisco 7301 que, cuando genera más tráfico durante nuestras horas pico, en comparación con el resto del día, BFD a veces se desconecta y enruta los viajes al siguiente enlace.
Parece que bajo altos volúmenes de tráfico, el uso de CPU del enrutador está aumentando (lo cual no es inusual), pero alrededor del 40-50% de los paquetes de CPU BFD no reciben suficientes recursos.
Sin embargo, he encontrado la siguiente información que sugiere problemas adicionales con BFD (de esta presentación de NANOG, hay más en la presentación, es buena, ¡dale una lectura!)
¿Cuáles son las advertencias?
- Dos principales:
- BFD puede tener altas demandas de recursos dependiendo de su escala.
- BFD no es visible para los protocolos de agrupación de capa 2. (LAG de Ethernet o paquetes POS)
Demandas de recursos de BFD
- El número de sesiones de BFD en cada tarjeta de línea o enrutador puede afectar qué tan bien BFD escala para usted. -Cada plataforma única tiene sus propios límites.
- Se han visto interfaces agrupadas que admiten un tx / rx mínimo de 250 ms o 2 segundos.
- En algunos casos, las instancias de BFD en un enrutador pueden necesitar ser operadas en el procesador de ruta dependiendo de la implementación (sesiones de BFD no basadas en adyacencia).
- Pruebe su plataforma primero antes de implementar BFD. Intente cargar la CPU RP o LC con sus ajustes configurados. Esto puede hacerse por:
- Ejecutando comandos pesados de CPU
- Los paquetes de inundación a TTL caducan en el destino
Demandas de recursos de BFD (continuación)
- ¿Qué valores son seguros de probar?
- Basado en hablar con varios operadores, 300ms con un multiplicador de 3 (detección de 900ms) parece ser un valor seguro que funciona bastante bien en la mayoría de los equipos.
- Esta es una mejora significativa sobre algunas de las alternativas.
BFD y L2 agrupación de enlaces
- BFD no tiene conocimiento de los miembros del paquete de enlaces L2 subyacentes.
- Un paquete 4x10GigE L2 (802.3ad) aparecería como una sola adyacencia L3. Los paquetes BFD se transmitirían en un enlace de un solo miembro, en lugar de los 4 enlaces.
- Un fallo del enlace con BFD en él daría lugar a un error completo de adyacencia L3.
- Sin embargo, en algunos escenarios, el enlace de miembro fallido puede provocar que solo se descarte un paquete BFD. Los paquetes posteriores pueden enrutarse a través de enlaces de miembros activos.