Question

Я написал веб-скрипт Python, который очищает URL-адреса, которые я хочу загрузить в формате PDF. Пример URL выглядит так:

http://website -address.com / FileHandler.ashx? ISSUE_ID = 638009647 & режим = PDF

По какой-то причине, когда я использую модуль Requests, будет загружен поврежденный файл, который говорит, что файл «был поврежден и неправильно декодирован». Я использую Microsoft Web Driver и Microsoft Edge. Я должен использовать этот веб-драйвер / браузер, поскольку он совместим с интранетом моей организации.

Вот снимок текущего метода, который я пытаюсь использовать для сохранения PDF:

resp = requests.get(url, verify = False, stream = True)
resp.raw.decode_content = True
with open('anyfilename.pdf', 'wb') as f:
    shutil.copyfileobj(resp.raw, f)

Я также попробовал более стандартный подход к написанию PDF:

resp = requests.get(url)
with open('anyfilename.pdf', 'wb') as f:
    f.write(resp.content)

Может ли кто-нибудь указать на мою ошибку, или это более сложная проблема из-за типа файла, который я пытаюсь загрузить?

Загрузка типа файла ASHX в PDF через Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Загрузка типа файла ASHX в PDF через Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов