Как извлечь основные топи c и подзаголовки c слова (жирное слово) из PDF в python? - PullRequest
0 голосов
/ 05 февраля 2020

Есть ли способ извлечь жирное слово из PDF? Есть ли способ извлечь только основные топи c слова и субтопи c слова? Я использовал множество библиотек python, таких как PyPDF2, Text-tact и многие другие. Я прочитал один PDF-файл и распечатал страницу за страницей. Но я не могу напечатать полный pdf вместе, а также не могу извлечь только слова с высоким весом, слова, выделенные жирным шрифтом, означают main и sub topi c words.

...