xargs
es rápido :
#!/usr/bin/bash
echo "while loop:"
n=0; time while (( n++ < 10000 )); do /usr/bin/true ; done
echo -e "\nfor loop:"
time for ((n=0;n<10000;n++)); do /usr/bin/true ; done
echo -e "\nseq,xargs:"
time seq 10000 | xargs -I{} -P1 -n1 /usr/bin/true
echo -e "\nyes,xargs:"
time yes x | head -n10000 | xargs -I{} -P1 -n1 /usr/bin/true
echo -e "\nparallel:"
time parallel --will-cite -j1 -N0 /usr/bin/true ::: {1..10000}
En un moderno Linux de 64 bits, da:
while loop:
real 0m2.282s
user 0m0.177s
sys 0m0.413s
for loop:
real 0m2.559s
user 0m0.393s
sys 0m0.500s
seq,xargs:
real 0m1.728s
user 0m0.013s
sys 0m0.217s
yes,xargs:
real 0m1.723s
user 0m0.013s
sys 0m0.223s
parallel:
real 0m26.271s
user 0m4.943s
sys 0m3.533s
Esto tiene sentido, ya que el xargs
comando es un proceso nativo único que genera el /usr/bin/true
comando varias veces, en lugar de los bucles for
y while
que se interpretan en Bash. Por supuesto, esto solo funciona para un solo comando; Si necesita hacer múltiples comandos en cada iteración del ciclo, será tan rápido, o tal vez más rápido, que pasar sh -c 'command1; command2; ...'
a xargs
También -P1
podría cambiarse, por ejemplo, -P8
para generar 8 procesos en paralelo para obtener otro gran impulso en la velocidad.
No sé por qué GNU paralelo es tan lento. Pensé que sería comparable a los xargs.
let ++n
lugar den=$((n+1))
(3 caracteres menos).