Извлечь данные (текст и изображения) из файла изображения - PullRequest
0 голосов
/ 08 февраля 2019

У меня есть файл PDF (содержимое в виде изображения в PDF), мне нужно извлечь текст и изображения из файла PDF.Я пробовал библиотеки PDF Converter в Laravel, но ни одна не работает.Итак, я преобразовал этот PDF в изображение с помощью Imagick, после чего с помощью TesseractOCR извлек текст из изображения (формат jpg), теперь мне нужно извлечь изображения также.Есть ли возможность извлечь текст и изображение из изображения.

Мой PDF похож на ниже

enter image description here

Я пробовал библиотеку TesseractOCR вLaravel, теперь я могу успешно извлечь текст.

$file = public_path().'/images/S29A57P1-4.jpg';
echo (new TesseractOCR($file))
        ->lang('eng')
        ->run();

Я хочу извлечь как текст, так и изображения из PDF или изображения.

...