Я написал веб-скрипт Python, который очищает URL-адреса, которые я хочу загрузить в формате PDF. Пример URL выглядит так:
http://website -address.com / FileHandler.ashx? ISSUE_ID = 638009647 & режим = PDF
По какой-то причине, когда я использую модуль Requests, будет загружен поврежденный файл, который говорит, что файл «был поврежден и неправильно декодирован». Я использую Microsoft Web Driver и Microsoft Edge. Я должен использовать этот веб-драйвер / браузер, поскольку он совместим с интранетом моей организации.
Вот снимок текущего метода, который я пытаюсь использовать для сохранения PDF:
resp = requests.get(url, verify = False, stream = True)
resp.raw.decode_content = True
with open('anyfilename.pdf', 'wb') as f:
shutil.copyfileobj(resp.raw, f)
Я также попробовал более стандартный подход к написанию PDF:
resp = requests.get(url)
with open('anyfilename.pdf', 'wb') as f:
f.write(resp.content)
Может ли кто-нибудь указать на мою ошибку, или это более сложная проблема из-за типа файла, который я пытаюсь загрузить?