xargs
is fast :
#!/usr/bin/bash
echo "while loop:"
n=0; time while (( n++ < 10000 )); do /usr/bin/true ; done
echo -e "\nfor loop:"
time for ((n=0;n<10000;n++)); do /usr/bin/true ; done
echo -e "\nseq,xargs:"
time seq 10000 | xargs -I{} -P1 -n1 /usr/bin/true
echo -e "\nyes,xargs:"
time yes x | head -n10000 | xargs -I{} -P1 -n1 /usr/bin/true
echo -e "\nparallel:"
time parallel --will-cite -j1 -N0 /usr/bin/true ::: {1..10000}
В современном 64-битном Linux дает:
while loop:
real 0m2.282s
user 0m0.177s
sys 0m0.413s
for loop:
real 0m2.559s
user 0m0.393s
sys 0m0.500s
seq,xargs:
real 0m1.728s
user 0m0.013s
sys 0m0.217s
yes,xargs:
real 0m1.723s
user 0m0.013s
sys 0m0.223s
parallel:
real 0m26.271s
user 0m4.943s
sys 0m3.533s
Это имеет смысл, так как *Команда 1010 * - это отдельный собственный процесс, который запускает команду /usr/bin/true
несколько раз вместо циклов for
и while
, которые все интерпретируются в Bash.Конечно, это работает только для одной команды;если вам нужно делать несколько команд в каждой итерации цикла, он будет таким же быстрым или, возможно, быстрее, чем передача sh -c 'command1; command2; ...'
в xargs
-P1
также можно изменить, скажем, на -P8
для запуска 8 параллельных процессов, чтобы получить еще один большой прирост скорости.
Я не знаю, почему параллельная GNU такая медленная.Я бы подумал, что это будет сравнимо с xargs.