парсинг PDF с использованием PHP - PullRequest
3 голосов
/ 30 июня 2011

Я знаю, что этот вопрос задавался несколько раз.И я проверил все, но никто не дал удовлетворительных ответов.

Некоторые говорят, что TCPDF может анализировать, но я искал на его сайте.ничего не дается, чтобы прочитать PDF.thn xpdf- xpdf - это утилита, которая должна быть установлена ​​на сервере, а затем запустить команды для извлечения текста.

Я даже искал FPDF, но на этом сайте также ничего не говорится о чтении pdf или какой-либо функции, связанной с readin в руководстве.

Так что мне нужно использовать pdfbox и java bridge для извлечения текста..?или какой-то народ может ответить, что это возможно с помощью tcpdf.

что предпочесть сейчас ...?

1 Ответ

1 голос
/ 30 июня 2011

Я думаю, что статус в основном такой же, как и был: нет собственных реализаций PHP парсера PDF. Существуют альтернативы командной строки , и я знаю, что есть реализации на других языках (я лично использую библиотеку Python), но нет нативных PHP.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...