Редактировать большой текстовый файл в Mac-терминале - PullRequest
2 голосов
/ 26 июля 2011

У меня есть очень большой файл словаря с 1 словом в каждой строке, и я хотел бы его обрезать.

Я хотел бы оставить 3-6 буквенные неправильные существительные, поэтому он имеетчтобы определить слова на основе этих слов:

  1. , если слово содержит менее 3 букв, удалить его
  2. , если слово содержит более 6 букв, удалить его
  3. если слово содержит заглавную букву, удалите его
  4. если слово содержит одну кавычку или пробел, удалите его.

Я использовал это:

cat Downloads/en-US/en-US.dic | egrep '[a-z]{3,6}' > Downloads/3-6.txt

но вывод неверный.Он выводит слова, содержащие более 3 символов, но это мой прогресс.

Так как же мне поступить в терминале Mac?Должен быть способ сделать это правильно?

Ответы [ 2 ]

2 голосов
/ 26 июля 2011

Следующая команда выберет только те слова, которые состоят ровно из трех-шести строчных аз-букв:

egrep '^[a-z]{3,6}$' /usr/share/dict/words > filtered.txt

Замените /usr/share/dict/words вашим входным файлом и filtered.txt именем вашего выходного файла,Я только что проверил, что это работает на моем Mac.Надеюсь, это поможет!

1 голос
/ 26 июля 2011

Используйте grep и напишите правило регулярного выражения, чтобы соответствовать строкам, которые вы хотите сохранить.Вы можете получить информацию о grep, набрав man grep в терминале.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...