Как извлечь текст, таблицы и изображения из PDF, используя python - PullRequest
0 голосов
/ 02 апреля 2020

У меня есть файл PDF, который состоит из текста, изображений и таблиц. Как мне извлечь 3 так, чтобы он определил, что извлечь, и делает ли он сам по себе?

1 Ответ

0 голосов
/ 02 апреля 2020

Python имеет пакет под названием PDFMiner. * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * Здесь go "."

...