Pérdida de paquete unidireccional


8

Recientemente, después de actualizar varios circuitos MetroE (conectividad L2) de 100Mbps a 1Gbps, noté que las transferencias de archivos grandes fallan entre algunos sitios; sin embargo, la transferencia solo falla en la dirección. Por ejemplo, considere el siguiente ejemplo.

De -> A

A -> B = Fallar

B -> A = Éxito

A -> C = Éxito

C -> A = Éxito

B -> C = Éxito

C -> B = Éxito

Cada sitio es un segmento enrutado detrás de un conmutador L3 ubicado en el sitio. El conmutador L3 se conecta al convertidor de medios CPE del proveedor, que a su vez se conecta a la red del proveedor a través de fibra. El enrutamiento estático se usa entre los interruptores L3.

            *Site A*                      *Site B*
    L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch
                               |
                              CPE
                               |
                           L3 Switch
                            *Site C*

El proveedor realizó pruebas de extremo a extremo de los circuitos de los CPE y no informó ninguna pérdida. Sin embargo, veo muchos ACK duplicados en una captura de paquetes en los hosts antes de que falle la transferencia.

Si elimino los interruptores L3 de la ecuación y conecto dos hosts directamente al dispositivo CPE en cada sitio, la transferencia de archivos se completa con éxito.

    Host A <-> CPE <--- Provider ---> CPE <-> Host B

Si coloco hosts a ambos lados de un conmutador L3, el enrutamiento interVLAN funciona sin problemas y la transferencia de archivos se completa con éxito.

    Host A1 <-> L3 Switch <-> Host A2

El problema solo parece ocurrir cuando los datos atraviesan al proveedor entre dos segmentos enrutados.

    Host A <-> L3 Switch <-> CPE <--- Provider ---> CPE <-> L3 Switch <-> Host B

He verificado varias cosas: las estadísticas de la interfaz son limpias (sin errores), baja utilización de la CPU y la memoria, coincidencia de velocidad y dúplex (cliente y CPE), tablas de MAC y ARP correctas, etc.

¿Cual podría ser el problema?

Actualización 1

Las capturas de paquetes de los hosts A y B se pueden encontrar en la siguiente URL:

https://www.dropbox.com/sh/5m2yohgxieelo59/AADed-0EWOkdmFIe0qT45_uQa

El problema ocurrió originalmente usando los conmutadores Juniper EX3200 que ejecutan 12.3R6.6. Posteriormente bajé los conmutadores a 11.4R6.6, pero esto no resolvió el problema.

Pude replicar el problema usando los conmutadores Juiper EX2200 que ejecutan 12.3R6.6 y 11.4R6.6. También pude replicar el problema con los conmutadores Dell 6224 que ejecutan 3.3.11.2.

Actualmente, solo el CPE (ge-0/0/0) y un único host (ge-0/0/1) están conectados a un Juniper EX3200 en cada sitio. Mientras solucionaba el problema, eliminé la configuración de cualquier parámetro extraño, por lo que la configuración es bastante básica. La configuración es esencialmente la misma en cada uno, pero con diferentes direcciones IP. Debajo hay un fragmento.

    # show interfaces
    ge-0/0/0 {
        unit 0 {
            family ethernet-switching {
                port-mode access;
                vlan {
                    members WAN;
                }
            }
        }
    }
    ge-0/0/1 {
        unit 0 {
            family ethernet-switching {
                port-mode access;
                vlan {
                    members LAN;
                }
            }
        }
    }
    vlan {
        unit 10 {
            description WAN;
            family inet {
                address 192.168.X.X/27;
            }
        }
        unit 100 {
            description LAN;
            family inet {
                targeted-broadcast;
                address 172.X.X.1/22;
            }
        }
    }

    # show vlans
    WAN {
        vlan-id 10;
        l3-interface vlan.10;
    }
    LAN {
        vlan-id 100;
        l3-interface vlan.100;
    }

Actualización 2

Hoy noté que si scp un archivo del conmutador L3, Juniper EX3200, en el sitio A al conmutador L3, Juniper EX3200, en el sitio B, la transferencia scp también se ve afectada por el problema.

Encuentro esto especialmente interesante ya que la transferencia se origina en la interfaz orientada al CPE en la VLAN WAN, porque si conecto una VLAN entre los sitios afectados a través de los conmutadores EX3200, las transferencias de archivos conmutadas se completan con éxito entre los hosts en los sitios A y B.


1
Hola Mike, gracias por la sugerencia. Sé por hablar con mi proveedor que configuran una MTU superior a 9000. Puedo pasar 1472 bytes en ambas direcciones, que es lo que esperaría de la MTU de facto 1500. Usar mturoute confirmó esto. Cualquier ping sobre 1472 falla con el conjunto de bits no fragmentar.
Paul Garrett

Olfatee la transferencia de archivos que falla de ambos lados simultáneamente y publique los resultados en cloudshark. También necesitamos detalles sobre la parte de la pregunta "interruptor L3". Cosas como fabricante, modelo, versión de firmware, configuración, números de puerto conectados, etc.
Mike Pennington

Cuando la transferencia de archivos falló, las capturas eran de alrededor de 19 MB, lo que es demasiado grande para clouldshark, así que cargué las capturas en Dropbox y compartí el enlace. Actualicé la publicación para incluir la información adicional que solicitó.
Paul Garrett

Considere agregar más detalles a la pregunta
Mike Pennington

Hubo un problema con la red del proveedor. No hay detalles adicionales disponibles.
Paul Garrett

Respuestas:


1

En el Firewall si está utilizando un SRX, verifique en qué están configuradas sus sesiones de flujo de seguridad y si está llegando al límite.

#show security flow session summary 
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.