Question

Увидев так много запросов на переполнение стека, я наконец-то решил извлечь изображения из PDF, но изображение может быть только в формате JPG / JPEG, но оно не работает для формата PNG, который присутствует внутри PDF.

startmark = b"\xff\xd8"
startfix = 0
endmark = b"\xff\xd9"
endfix = 2
i = 0
n_jpg=0

istream = content3.find(b"stream", i)
istart = content3.find(startmark, istream, istream+20)
if istart < 0:
    i = istream+20
iend = content3.find(b"endstream", istart)
if iend < 0:
    raise Exception("Didn't find end of stream!")
iend = content3.find(endmark, iend-20)
if iend < 0:
    raise Exception("Didn't find end of JPG!")
istart += startfix
iend += endfix
print("JPG %d from %d to %d" % (njpg, istart, iend))
jpg = content3[istart:iend]

Как это можно использовать для файла PNG?Когда я извлек png-файл, я увидел \ x89PNG в качестве начальной точки и \ xaeB` \ x82 в качестве конечной точки.Но я получаю сообщение об ошибке при чтении «потока»

Exception: Didn't find end of stream!

Обратите внимание, что оно мне нужно в виде байтов, которые можно использовать для дальнейшей обработки

Заранее спасибо

Как извлечь изображение PNG из файла PDF с помощью Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как извлечь изображение PNG из файла PDF с помощью Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов