PDF извлечение текста - получить словарь заголовка в качестве ключа и параграфа в качестве значения - PullRequest
0 голосов
/ 23 сентября 2019

Тот же вопрос был задан здесь и здесь Но я не смог найти способ извлечь только заголовки из PDF-файла.Допустим, файл PDF был создан из текстового документа, который имеет структурированные заголовки и абзацы, написанные внутри него.Теперь, что я хотел бы сделать, это извлечь все заголовки вместе с их абзацами, написанными внутри него в виде словаря.

Есть ли какой-нибудь способ, которым я могу достичь этой функциональности в python, если да, был бы признателенначальное руководство.Спасибо

...