как мне найти самые распространенные слова unix - PullRequest
0 голосов
/ 28 марта 2020

У меня есть текстовый файл, и я хочу найти в нем наиболее распространенные пары слов.
Я нашел команду:

tr -c '[:alnum:]' '[\n*]' < test.txt | sort | uniq -c | sort -nr | head  -10

, которая дает мне список из 10 наиболее распространенных слов .
Мне нужно заменить его на пары слов.

1 Ответ

0 голосов
/ 29 марта 2020

Попробуйте это

tr '[:space:]' '[\n*]' < file_name | sort | uniq -c | sort -nr -k1 | head

В вашей команде вы заменяете символ новой строкой вместо пробелов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...