Загрузите zip-файл с URL-адреса с помощью модуля запросов в python - PullRequest
0 голосов
/ 11 июля 2020

, когда я захожу на этот веб-сайт , мой браузер открывает окно для загрузки zip-файла.

Я пытаюсь загрузить zip-файл с помощью сценария python (я начинающий программист). Я хотел бы автоматизировать процесс загрузки пакета похожих ссылок в будущем, но пока я тестирую только одну ссылку. Вот мой код:

import requests

url = 'https://sigef.incra.gov.br/geo/exportar/vertice/shp/454698fd-6dfa-49a1-8096-bd9bb57b62ca'
r = requests.get(url, verify=False, allow_redirects=True)

open('verticeshp454698fd-6dfa-49a1-8096-bd9bb57b62ca.zip', 'wb').write(r.content)

В результате я получаю битый zip-файл, а не тот, который мне нужен. Я также получаю следующее сообщение в командной строке:

C:\Users\joaop\AppData\Local\Programs\Python\Python38\lib\site-packages\urllib3\connectionpool.py:979: InsecureRequestWarning: Unverified HTTPS request is being made to host 'sigef.incra.gov.br'. Adding certificate verification is strongly advised. See: https://urllib3.readthedocs.io/en/latest/advanced-usage.html#ssl-warnings
  warnings.warn(

Какие шаги мне здесь не хватает? Заранее благодарим за помощь.

1 Ответ

0 голосов
/ 11 июля 2020

Я заставил его работать, добавив / в конце URL-адреса

import requests

# the `/` at the end is important
url = 'https://sigef.incra.gov.br/geo/exportar/vertice/shp/454698fd-6dfa-49a1-8096-bd9bb57b62ca/'

headers = {
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2866.71 Safari/537.36", 
  }

r = requests.get(url, headers=headers, verify=False, allow_redirects=True)

# get the filename from the headers `454698fd-6dfa-49a1-8096-bd9bb57b62ca_vertice.zip`
filename = r.headers['Content-Disposition'].split("filename=")[-1]

with open(filename, 'wb') as f:
  f.write(r.content)

Посмотрите в действии здесь .

...