Question

Я читаю файл PDF в моей программе python. Я прочитал каждую страницу с PDF2PY следующим образом:

    pdfFileObject = open(path, 'rb')
    pdfReader = PyPDF2.PdfFileReader(pdfFileObject)

    for i in range(0, pdfReader.numPages):
        pageObject = pdfReader.getPage(i)
        string = pageObject.extractText()

Дело в том, что, если у меня есть следующая информация на моей странице PDF

line1
line2

Вывод: line1line2 (без пробелов между строками). Поэтому я хотел бы читать файл не только постранично, но и построчно, чтобы я мог соединять строки вручную, добавляя пространство между ними. Я видел подобные вопросы здесь, но ни одно из найденных решений не сработало для меня.

Извлечение содержимого PDF построчно с PDF2Py

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Извлечение содержимого PDF построчно с PDF2Py

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов