считать длину символа из большого файла - PullRequest
0 голосов
/ 08 апреля 2019

Мне нужно найти длину символа в файле, содержащем 140000 строк, длина каждой строки варьируется.

aaaaa
bbb
ccccc
ddddd
fff

Ожидается вывод, как показано ниже

strings char-length
2       3
3       5

(означает, что длина строки в 2 строки равна3, 3 строки длины символа 5).Я уже пробовал цикл for, который читает каждую строку, но это занимает время, так как в моем файле было 140000 строк.

1 Ответ

0 голосов
/ 08 апреля 2019

Если у вас есть awk, вы можете попробовать следующую команду:

awk '{ print length($0) }' <your_file> | sort | uniq -c

(Взял 27 мс на моей виртуальной машине с образцом тестового файла из 7000 строк, каждая строка длиной около 10 символов).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...