Войти

Запомнить

Регистрация

Лента
Топ
Теги
Новая

Mms 27 сентября 2018 60

PyPDF2 для извлечения вертикального текста из отсканированного PDF

0 голосов

Mms / 27 сентября 2018

Я пытаюсь извлечь текст из отсканированного PDF с помощью PyPDF2.Некоторые из pdf содержат текст, выровненный по вертикали.Но ориентация страницы - Портрет.Есть ли способ определить, выровнен ли текст по вертикали и читать вертикальные линии в PDF, используя pdfminer или PyPDF2

питон
питон-3.x
pypdf2
pdfminer
PDF-экстракция

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.

Похожие темы

Как проверить, является ли PDF отсканированным изображением или содержит текст
Как различить guish загруженных PDF-файлов для извлечения данных с помощью регулярного выражения в python Django
Как извлечь PDF-документ, содержащий текст и изображение, используя Python?
Как извлечь изображения и изображения BBox координат с помощью Python?
Как извлечь текст из PDF в Python 3.7.3
Сравните цифры в двух отдельных PDF-файлах? (Python)
Как заставить PDF показывать имя файла вместо названия, используя программу?
Есть ли способ удалить определенную часть из PDF, используя python
Какой лучший способ извлечь текст из PDF в Python без изменения макета и формата?
Извлечение текста из PDF с Python в ответ

...