Question

У меня есть файл, который содержит несколько тысяч чисел, каждое в своей строке:

Я хочу написать скрипт, который будет печатать сумму всех чисел в файле. У меня есть решение, но оно не очень эффективно. (Запуск занимает несколько минут.) Я ищу более эффективное решение. Есть предложения?

brian d foy · Answer 1 · 24 апреля 2010

Для однострочника Perl это в основном то же самое, что и решение awk в Ответ Аймана Хури :

 % perl -nle '$sum += $_ } END { print $sum'

Если вам интересно, что делают однострочники Perl, вы можете их отменить:

 %  perl -MO=Deparse -nle '$sum += $_ } END { print $sum'

В результате получается более подробная версия программы в форме, которую никто никогда не написал бы самостоятельно:

BEGIN { $/ = "\n"; $\ = "\n"; }
LINE: while (defined($_ = <ARGV>)) {
    chomp $_;
    $sum += $_;
}
sub END {
    print $sum;
}
-e syntax OK

Только для хихиканья, я попробовал это с файлом, содержащим 1 000 000 чисел (в диапазоне 0 - 9 999). На моем Mac Pro он возвращается практически мгновенно. Это очень плохо, потому что я надеялся, что использование mmap будет очень быстрым, но это в то же время:

use 5.010;
use File::Map qw(map_file);

map_file my $map, $ARGV[0];

$sum += $1 while $map =~ m/(\d+)/g;

say $sum;

devnull · Answer 2 · 07 декабря 2013

Пока ни одно из решений не использует paste. Вот один из них:

paste -sd+ filename | bc

В качестве примера вычислите Σn, где 1 <= n <= 100000: </p>

$ seq 100000 | paste -sd+ | bc -l
5000050000

(Для любопытных seq n напечатает последовательность чисел от 1 до n с положительным числом n.)

glenn jackman · Answer 3 · 22 августа 2013

Просто для удовольствия, давайте оценим это:

$ for ((i=0; i<1000000; i++)) ; do echo $RANDOM; done > random_numbers

$ time perl -nle '$sum += $_ } END { print $sum' random_numbers
16379866392

real    0m0.226s
user    0m0.219s
sys     0m0.002s

$ time awk '{ sum += $1 } END { print sum }' random_numbers
16379866392

real    0m0.311s
user    0m0.304s
sys     0m0.005s

$ time { { tr "\n" + < random_numbers ; echo 0; } | bc; }
16379866392

real    0m0.445s
user    0m0.438s
sys     0m0.024s

$ time { s=0;while read l; do s=$((s+$l));done<random_numbers;echo $s; }
16379866392

real    0m9.309s
user    0m8.404s
sys     0m0.887s

$ time { s=0;while read l; do ((s+=l));done<random_numbers;echo $s; }
16379866392

real    0m7.191s
user    0m6.402s
sys     0m0.776s

$ time { sed ':a;N;s/\n/+/;ta' random_numbers|bc; }
^C

real    4m53.413s
user    4m52.584s
sys 0m0.052s

Я прервал запуск через 5 минут

Я нырнул в Луа , и это быстро:

$ time lua -e 'sum=0; for line in io.lines() do sum=sum+line end; print(sum)' < random_numbers
16388542582.0

real    0m0.362s
user    0m0.313s
sys     0m0.063s

и пока я обновляю это, ruby:

$ time ruby -e 'sum = 0; File.foreach(ARGV.shift) {|line| sum+=line.to_i}; puts sum' random_numbers
16388542582

real    0m0.378s
user    0m0.297s
sys     0m0.078s

Прислушайтесь к совету Эда Мортона: используйте $1

$ time awk '{ sum += $1 } END { print sum }' random_numbers
16388542582

real    0m0.421s
user    0m0.359s
sys     0m0.063s

против использования $0

$ time awk '{ sum += $0 } END { print sum }' random_numbers
16388542582

real    0m0.302s
user    0m0.234s
sys     0m0.063s

nisetama · Answer 4 · 06 декабря 2015

Другой вариант - использовать jq:

$ seq 10|jq -s add
55

-s (--slurp) считывает строки ввода в массив.

lhf · Answer 5 · 26 апреля 2010

Вот еще одна строчка

( echo 0 ; sed 's/$/ +/' foo ; echo p ) | dc

Предполагается, что числа целые. Если вам нужны десятичные дроби, попробуйте

( echo 0 2k ; sed 's/$/ +/' foo ; echo p ) | dc

Отрегулируйте 2 до необходимого количества десятичных знаков.

hertzsprung · Answer 6 · 13 сентября 2016

Я предпочитаю использовать GNU datamash для таких задач, потому что он более краткий и разборчивый, чем perl или awk. Например

datamash sum 1 < myfile

где 1 обозначает первый столбец данных.

fedorn · Answer 7 · 04 января 2015

Я предпочитаю использовать R для этого:

$ R -e 'sum(scan("filename"))'

Как я могу быстро сложить все числа в файле?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 28 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как я могу быстро сложить все числа в файле?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 28 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы