У меня есть следующий код для извлечения PDF в JPG. Мне пришлось изменить размер img из-за большого размера, я потерял исходный формат PDF (A4, A3 и c ..):
with Img(filename=pdfName, resolution=self.resolution) as document:
reader = PyPDF2.PdfFileReader(pdfName.replace('[0]', ''))
for page_number, page in enumerate(document.sequence):
pdfSize = reader.getPage(page_number).mediaBox
width = pdfSize[2]
height = pdfSize[3]
with Img(page, resolution=self.resolution) as img:
# Do not resize first page, which used to find useful informations
if not get_first_page:
img.resize(int(width), int(height))
img.compression_quality = self.compressionQuality
img.background_color = Color("white")
img.alpha_channel = 'remove'
if get_first_page:
filename = output
else:
filename = tmpPath + '/' + 'tmp-' + str(page_number) + '.jpg'
img.save(filename=filename)
Так что для каждой страницы я читаю размер PDF и измените размер вывода, сделанного с помощью палочки. Но моя проблема в качестве jpg, которое действительно плохое ...
Мое разрешение 300 (я пытаюсь с верхним значением, без успеха), а качество сжатия 100
Есть идеи?
Спасибо