Самый простой способ получить как текст, так и изображения из PDF-файла на PHP? - PullRequest
3 голосов
/ 18 марта 2012

Я хочу извлечь как текст, так и изображения из PDF-файла, используя PHP.Кажется, что все библиотеки предназначены для чтения, и большинство других решений либо создают только текст, либо только изображения, либо основаны на командной строке.Я ищу полное решение на PHP.Возможно ли это?

На данный момент я также открыт для других предложений, например, возможно, существует сайт с API, на который вы можете отправить файл?Или, может быть, кто-то может дать инструкции по современному решению, использующему инструмент командной строки OpenOffice, хотя бы это возможно?

1 Ответ

0 голосов
/ 20 марта 2012

А как насчет API Google Docs? У них есть OCR, с которым вы могли бы работать.

https://developers.google.com/google-apps/documents-list/#uploading_documents_using_optical_character_recognition_ocr

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...