Извлечь текст из PDF-файла с Python - PullRequest
0 голосов
/ 26 февраля 2019

Я хотел бы извлечь текст, включая таблицы из файла PDF.

Я пытался camelot.Он не может получить только данные таблицы, но не текст.

Я также пробовал PDF2.Он не может читать китайские иероглифы.

Вот пример pdf для чтения.

Что мне следует попробовать дальше?

Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...