Искать PDF и извлечь страницу, когда найден - PullRequest
1 голос
/ 31 августа 2011

Кто-нибудь знает, как искать в многостраничном PDF-файле какой-либо текст (например, номер счета), а затем извлекать эту страницу в отдельный файл?Я вижу, как можно использовать FPDI для извлечения конкретной страницы, а затем использовать FPDF для изменения и сохранения.Часть, которую я не могу понять, это как искать в pdf и определить номер страницы, на которой находится текст.Желательно, чтобы это было сделано с помощью php, но я бы хотел использовать что-то еще, если необходимо.

Есть какие-нибудь предложения?

Спасибо.

1 Ответ

0 голосов
/ 29 августа 2012

Эта страница помогла мне найти решение:

http://www.freak -search.com / ru / thread / 2817957 / find_page_number_conisting_a_given_text

В основном вы используете командуСтрока программы "pdftotext" в bash-скрипте (см. ссылку) для возврата номера страницы и затем FPDI для извлечения страницы.Прекрасно работает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...