Как извлечь содержимое PDF, исключая таблицы из этого PDF в Python? - PullRequest
0 голосов
/ 25 сентября 2019

Я использовал библиотеку Tika, но она извлекает все, включая содержимое таблицы

from tika import parser
raw = parser.from_file('jk.pdf')
print(raw['content'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...