Есть ли способ извлечь весь текст, не теряя его формат структуры ..? - PullRequest
0 голосов
/ 05 июля 2019

Я должен извлечь весь текст из PDF без потери его структуры.Мне нужен один с его структурой (с отступом текстов).В этом формате с правильным отступом: Когда я использую Pdfminer, он извлекает весь текст и печатает построчно. Потерял свою структуру (отступ).Для текстового содержимого в pdf заголовок начинается в основном с первой позиции новой строки.И заголовок раздела начинается со следующего символа новой строки после некоторой вкладки пробела.таким же образом.Это с правильным отступом текста.Кто-нибудь может мне помочь?

...