У меня есть такой текстовый файл:
tom
and
jerry
went
to
america
and
england
Я хочу получить частоту каждого слова.
Когда я попробовал следующую команду
sort test.txt|uniq -c
Я получил следующий вывод
1 america
2 and
1 england
1 jerry
1 to
1 tom
1 went
Но мне тоже нужны частичные совпадения.то есть слово to
присутствует в слове tom
.Таким образом, мое ожидаемое количество слов to
равно 2. Возможно ли использовать unix
команды?