У меня есть несколько файлов экспорта, вы можете предположить, что они содержат много слов в одной строке, и ни одна строка не является особенной.Я видел этот пост, чтобы генерировать разные слова в файле
https://unix.stackexchange.com/questions/286464/all-possible-permutations-of-words-in-different-files-in-pairs
, а также есть некоторые другие варианты поиска слов в файле.
Но что мне нужноэто что-то вроде этого для подстрок длины четыре.Здесь у нас есть подстрока и ее количество.
Пример файла содержимого
no apples
no apples
mango is great
banana is expensive
test
Пример вывода
appl 2
pple 2
ples 2
mang 1
ango 1
grea 1
reat 1
bana 1
anan 1
nana 1
expe 1
xpen 1
pens 1
ensi 1
sive 1
nsiv 1
test 1
Подстроки не обязательно имеют какое-либо значение,они просто подстроки файла.Файл не большой, менее 5 МБ в худшем случае, на самом деле есть несколько файлов, но я объединил их перед анализом.
Я хотел спросить в SO, потому что в случае, если это требует написания сценария оболочки / фитона, но если мы сможем сделать это легко с помощью команд, это будет более ценно.