Как искать содержимое нескольких файлов PDF? - PullRequest
200 голосов
/ 10 января 2011

Как я могу искать содержимое файлов PDF в каталоге / подкаталоге? Я ищу некоторые инструменты командной строки. Кажется, grep не может искать файлы PDF.

Ответы [ 12 ]

0 голосов
/ 10 января 2011

попробуйте использовать 'acroread' в простом скрипте, подобном приведенному выше

0 голосов
/ 10 января 2011

Вам понадобятся некоторые инструменты, такие как pdf2text, чтобы сначала преобразовать ваш pdf в текстовый файл, а затем искать внутри текста.(Вероятно, вы пропустите некоторую информацию или символы).

Если вы используете язык программирования, вероятно, для этой цели написаны библиотеки pdf.например, http://search.cpan.org/dist/CAM-PDF/ для Perl

...