PyPDF2 возвращает отрицательное измерение - PullRequest
0 голосов
/ 15 января 2019

Я использую PyPDF2, чтобы получить размер страниц PDF-файла, но он возвращает отрицательное число для некоторых PDF-файлов. Зачем? Вот пример , начиная со второй страницы, реальная высота отрицательна.

from PyPDF2 import PdfFileReader

input_file = PdfFileReader(open('file.pdf', "rb"))
for i in range(input_file.getNumPages()):
    page = input_file.getPage(i)
    real_width, real_height = page.mediaBox.getWidth(), 
page.mediaBox.getHeight()
    print(real_width, real_height)

Реальная высота в некоторых случаях отрицательна, как это может произойти?

1 Ответ

0 голосов
/ 15 января 2019

Потому что это высота страницы в метаданных в файле

MediaBox [0 0 792 -612]

Вы должны спросить, кто бы ни сгенерировал файл, как им это удалось!Вы могли бы просто перевернуть его.

...