Recientemente, después de actualizar varios circuitos MetroE (conectividad L2) de 100Mbps a 1Gbps, noté que las transferencias de archivos grandes fallan entre algunos sitios; sin embargo, la transferencia solo falla en la dirección. Por ejemplo, considere el siguiente ejemplo.
De -> A
A -> B = Fallar
B -> A = Éxito
A -> C = Éxito
C -> A = Éxito
B -> C = Éxito
C -> B = Éxito
Cada sitio es un segmento enrutado detrás de un conmutador L3 ubicado en el sitio. El conmutador L3 se conecta al convertidor de medios CPE del proveedor, que a su vez se conecta a la red del proveedor a través de fibra. El enrutamiento estático se usa entre los interruptores L3.
*Site A* *Site B*
L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch
|
CPE
|
L3 Switch
*Site C*
El proveedor realizó pruebas de extremo a extremo de los circuitos de los CPE y no informó ninguna pérdida. Sin embargo, veo muchos ACK duplicados en una captura de paquetes en los hosts antes de que falle la transferencia.
Si elimino los interruptores L3 de la ecuación y conecto dos hosts directamente al dispositivo CPE en cada sitio, la transferencia de archivos se completa con éxito.
Host A <-> CPE <--- Provider ---> CPE <-> Host B
Si coloco hosts a ambos lados de un conmutador L3, el enrutamiento interVLAN funciona sin problemas y la transferencia de archivos se completa con éxito.
Host A1 <-> L3 Switch <-> Host A2
El problema solo parece ocurrir cuando los datos atraviesan al proveedor entre dos segmentos enrutados.
Host A <-> L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch <-> Host B
He verificado varias cosas: las estadísticas de la interfaz son limpias (sin errores), baja utilización de la CPU y la memoria, coincidencia de velocidad y dúplex (cliente y CPE), tablas de MAC y ARP correctas, etc.
¿Cual podría ser el problema?
Actualización 1
Las capturas de paquetes de los hosts A y B se pueden encontrar en la siguiente URL:
https://www.dropbox.com/sh/5m2yohgxieelo59/AADed-0EWOkdmFIe0qT45_uQa
El problema ocurrió originalmente usando los conmutadores Juniper EX3200 que ejecutan 12.3R6.6. Posteriormente bajé los conmutadores a 11.4R6.6, pero esto no resolvió el problema.
Pude replicar el problema usando los conmutadores Juiper EX2200 que ejecutan 12.3R6.6 y 11.4R6.6. También pude replicar el problema con los conmutadores Dell 6224 que ejecutan 3.3.11.2.
Actualmente, solo el CPE (ge-0/0/0) y un único host (ge-0/0/1) están conectados a un Juniper EX3200 en cada sitio. Mientras solucionaba el problema, eliminé la configuración de cualquier parámetro extraño, por lo que la configuración es bastante básica. La configuración es esencialmente la misma en cada uno, pero con diferentes direcciones IP. Debajo hay un fragmento.
# show interfaces
ge-0/0/0 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members WAN;
}
}
}
}
ge-0/0/1 {
unit 0 {
family ethernet-switching {
port-mode access;
vlan {
members LAN;
}
}
}
}
vlan {
unit 10 {
description WAN;
family inet {
address 192.168.X.X/27;
}
}
unit 100 {
description LAN;
family inet {
targeted-broadcast;
address 172.X.X.1/22;
}
}
}
# show vlans
WAN {
vlan-id 10;
l3-interface vlan.10;
}
LAN {
vlan-id 100;
l3-interface vlan.100;
}
Actualización 2
Hoy noté que si scp un archivo del conmutador L3, Juniper EX3200, en el sitio A al conmutador L3, Juniper EX3200, en el sitio B, la transferencia scp también se ve afectada por el problema.
Encuentro esto especialmente interesante ya que la transferencia se origina en la interfaz orientada al CPE en la VLAN WAN, porque si conecto una VLAN entre los sitios afectados a través de los conmutadores EX3200, las transferencias de archivos conmutadas se completan con éxito entre los hosts en los sitios A y B.