В вашем дистрибутиве должна быть утилита с именем pdftotext
:
find /path -name '*.pdf' -exec sh -c 'pdftotext "{}" - | grep --with-filename --label="{}" --color "your pattern"' \;
"-" необходимо для вывода pdftotext на стандартный вывод, а не на файлы.Опции --with-filename
и --label=
поместят имя файла в вывод grep.Необязательный флаг --color
является хорошим и указывает grep выводить, используя цвета на терминале.
(В Ubuntu pdftotext
предоставляется пакетом xpdf-utils
или poppler-utils
.)
Этот метод, использующий pdftotext
и grep
, имеет преимущество перед pdfgrep
, если вы хотите использовать функции GNU grep
, которые pdfgrep
не поддерживает. Примечание : pdfgrep-1.3.x поддерживает опцию -C
для печати строки контекста.