загрузка данных с помощью блоб-ссылки - PullRequest
0 голосов
/ 12 апреля 2020

используя данные с этого сайта: https://ourworldindata.org/grapher/total-daily-covid-deaths?tab=map

Я пытаюсь взаимодействовать со ссылкой 'total-daily-covid-deaths.csv', которая имеет ссылку href 'blob : https://ourworldindata.org/b1c6f69e-4df4-4458-8aa0-35173733b364». После нажатия на ссылку я попадаю на страницу с большим количеством данных, и я просто пытаюсь написать сценарий python, чтобы взять эти данные и поместить их в файл csv для использования. Исследуя это, я обнаружил, что было огромное количество информации, и я очень быстро запутался. У меня есть опыт просмотра веб-страниц с использованием красивого супа и запросов, однако я не смог заставить его работать, так как ссылка на блоб не является реальным веб-сайтом. Я надеялся, что кто-нибудь сможет пролить на меня свет и направить меня в правильном направлении.

Вот код, который я использую:

import urllib.request as request

url = 'https://ourworldindata.org/grapher/total-daily-covid-deaths?tab=map'
# fake user agent of Safari
fake_useragent = 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'
r = request.Request(url, headers={'User-Agent': fake_useragent})
f = request.urlopen(r)

# print or write
print(f.read())

1 Ответ

0 голосов
/ 12 апреля 2020

URL-адреса BLOB-объектов уже описаны ниже.
Преобразование URL-адреса BLOB-объекта в обычный URL-адрес

Можете ли вы поделиться своим фрагментом кода, чтобы получить лучшее представление о вашей проблеме.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...