Тот же вопрос был задан здесь и здесь Но я не смог найти способ извлечь только заголовки из PDF-файла.Допустим, файл PDF был создан из текстового документа, который имеет структурированные заголовки и абзацы, написанные внутри него.Теперь, что я хотел бы сделать, это извлечь все заголовки вместе с их абзацами, написанными внутри него в виде словаря.
Есть ли какой-нибудь способ, которым я могу достичь этой функциональности в python, если да, был бы признателенначальное руководство.Спасибо