Я использовал библиотеку Tika, но она извлекает все, включая содержимое таблицы
from tika import parser raw = parser.from_file('jk.pdf') print(raw['content'])