Есть ли способ извлечь "To", "From", "Subject", "Body Text" из почтового pdf документа с использованием python? - PullRequest
0 голосов
/ 25 мая 2019

У меня есть PDF-документ, преобразованный из почты.Я хочу извлечь "Кому", "От", "Предмет", "Текст тела".Я использую pdfminer, но он захватывает весь текст.Я просто хочу, но отдельно.Заранее благодарен за помощь.

Я уже пробовал с PYDF2, но он возвращает символы тарабарщины, а не текст.Поэтому я использую PDF Miner для этого.

...