Я хочу найти весь словарь из текстового файла (он конвертируется из настоящей книги, так что, может быть, больше, и решение должно быть эффективным), и я вывел словарь в текстовый файл с именем voclist. некоторые недопустимые слова, которые я хочу удалить, например (aa, aazzz).
Я пробовал "egrep [a-z] + voclist".
Конечно, это не сработает.
This is the block contain illegal words:
2 accepting
2 absence
1 zz
1 yyybb
1 yarn
I want output like this:
2 accepting
2 absence
1 yarn
Я много раз думаю об этом вопросе. Удалите «yyybb» и одновременно оставьте «принимать», может быть, немного затруднительно, а «yyybb» редко встречается в настоящей книге, поэтому мы можем просто удалить «zz». У кого-нибудь есть идеи?