PHP - Проверить, содержит ли pdf данный текст - TcpdfFpdi / pdftk / fpdi - PullRequest
0 голосов
/ 11 октября 2018

У меня есть документ pdf, и я хочу проверить, встречается ли в документе определенный текст (тэги, которые я вставил при создании pdf), однако, используя эти библиотеки (tcpdfFpdi, pdftk или fdpi), я не смогвыяснить, возможно ли это или как это сделать.

$str = "{hello}";

$pdf = new TcpdfFpdi();
$pdf->setSourceFile($filePath);

$pdf->searchForText($str); // something like this which returns boolean

Если я попытаюсь без какой-либо библиотеки набрать dd(file_get_contents($filePath)), он вернет очень длинный вывод и, похоже, не содержит файл, который я хочу, поэтому ядумаю, что лучше использовать одну из этих библиотек.

1 Ответ

0 голосов
/ 11 октября 2018

Просто идея ...

Это не настоящее решение PHP, но вы можете использовать такие инструменты, как pdftotext, которые я знаю из этого поста (где файл PDF преобразуется в строку для подсчета его слов): https://superuser.com/a/221367/535203

Вы можете установить и поиграть с этой командой и вызывать ее из своего PHP-приложения.

Насколько я помню (давно, с тех пор как я использовал pdftotext)Выводимый текст - это не только содержимое PDF, но поиск по нескольким тегам в нем - это, по крайней мере, хорошая попытка.

...