У меня есть очень большой файл словаря с 1 словом в каждой строке, и я хотел бы его обрезать.
Я хотел бы оставить 3-6 буквенные неправильные существительные, поэтому он имеетчтобы определить слова на основе этих слов:
- , если слово содержит менее 3 букв, удалить его
- , если слово содержит более 6 букв, удалить его
- если слово содержит заглавную букву, удалите его
- если слово содержит одну кавычку или пробел, удалите его.
Я использовал это:
cat Downloads/en-US/en-US.dic | egrep '[a-z]{3,6}' > Downloads/3-6.txt
но вывод неверный.Он выводит слова, содержащие более 3 символов, но это мой прогресс.
Так как же мне поступить в терминале Mac?Должен быть способ сделать это правильно?