У меня есть ссылка на файл PDF, который я хотел бы загрузить. Я попробовал следующее:
import requests
class Scraper:
def __init__(self):
"""Init the class"""
@staticmethod
def download(full_url):
"""Download full url pdf"""
with requests.Session() as req:
# Init
r = req.get(full_url, allow_redirects=True)
localname = 'test.pdf'
# Download
if r.status_code == 200: #and r.headers['Content-Type'] == "application/pdf;charset=UTF-8":
with open(f"{localname}", 'wb') as f:
f.write(r.content)
else:
pass
Однако после загрузки, когда я пытаюсь открыть его на своем компьютере, я получаю сообщение:
"Не удалось открыть [FILENAME]. pdf, потому что это либо не поддерживаемый тип файла, либо файл поврежден (...) "
- В чем причина этого? Это потому, что при первом посещении этой страницы вы будете перенаправлены и вам нужно будет выбрать некоторые настройки?
- Как мы можем решить эту проблему?