Использование pdfgrep для поиска предложений, содержащих определенные слова - PullRequest
0 голосов
/ 30 ноября 2018

Для моего экзамена по статистике я хотел бы иметь возможность искать предложения, содержащие конкретные слова, в нашем учебнике (у нас есть в виде файла PDF).Я скачал инструмент командной строки pdfgrep (grep для файлов pdf)

Пример:

Я хотел бы найти предложение, содержащее два слова "медиана" и "экспонента"

Я пробовал:

pdfgrep "\..*median.*exponential\." book-IntroStatistics.pdf 

Но, похоже, это не работает, а просто дает мне большие куски текста.

1 Ответ

0 голосов
/ 30 ноября 2018

Вы можете использовать

pdfgrep '[^?\!.]*median[^?\!.]*exponential[^?\!.]*' book-IntroStatistics.pdf

Детали [^?\!.]* соответствуют любым 0+ символам, кроме ?, ! и . символов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...