В качестве упражнения я пытаюсь вывести, сколько слов существует в словаре для каждой возможной длины.
Вот мой код:
$ awk '{print length}' dico.txt | sort -nr | uniq -c
Вот вывод:
...
1799 5
427 4
81 3
1 2
Моя проблема в том, что длина awk рассчитывает еще одну букву для каждого слова в моем файле. Правильный вывод должен был быть:
1799 4
427 3
81 2
1 1
Я проверил свой файл, и после слова:
он не содержит пробелов.
ABAISSA
ABAISSABLE
ABAISSABLES
ABAISSAI
...
Так что я думаю, что awk считает символ новой строки символом, несмотря на то, что это не предполагается.
Есть ли решение? Или я что-то не так делаю?