PyPDF2 для извлечения вертикального текста из отсканированного PDF - PullRequest
0 голосов
/ 27 сентября 2018

Я пытаюсь извлечь текст из отсканированного PDF с помощью PyPDF2.Некоторые из pdf содержат текст, выровненный по вертикали.Но ориентация страницы - Портрет.Есть ли способ определить, выровнен ли текст по вертикали и читать вертикальные линии в PDF, используя pdfminer или PyPDF2

...