Как извлечь PDF-документ, содержащий текст и изображение, используя Python? - PullRequest
0 голосов
/ 16 мая 2019

У меня есть PDF-файл (содержит текст и изображение), и я хочу извлечь из этого PDF-файла как текстовые данные, так и данные изображений.Я пробовал tesseract, но при его использовании происходит преобразование всего документа PDF в изображение.Есть ли возможность извлечь как текст, так и изображение из PDF-документа

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...