Tanto el software como el hardware tienen algo que decir. Tengo la comparación de Intel y TP-Link NIC (que utiliza un chip Realtek en su corazón) en el hardware del servidor genérico, así como el software especialmente diseñado y genérico en el enrutamiento.
En el lado del hardware, si el ASIC a bordo puede manejar el tráfico IP, la carga del procesador puede ser menor y, por lo tanto, más rápida. He notado que los dos chips Ntel INtel integrados se comunican directamente por DMA, sin pasar por la CPU principal en el manejo del reenvío de paquetes; mientras tanto, el chip Realtek se interrumpe cada vez que llega un paquete.
En el lado del software, si el software está diseñado para usarse en el enrutamiento, se puede hacer más eficiente. He usado pfSense + PF (un FreeBSD modificado destinado a ser utilizado como enrutador) y Ubuntu 12.04 + iptables genéricos como software de enrutamiento y el primero claramente cambia el tráfico mucho más rápido. (Ubuntu 14.04 ahora es casi tan rápido, gracias a los nuevos nftables en el kernel de Linux 3.13).
Sin embargo, el enrutador dedicado tiene un inconveniente importante: no puede realizar mucho más que cambiar el tráfico y no se puede virtualizar. Mi enrutador perimetral actual es una máquina virtual dentro de mi clúster ESXi que ejecuta Ubuntu 14.04, y también actúa como un sistema de detección de intrusos y equilibrador de carga.