Получение новейшего URL-адреса для применения в get.requests - PullRequest
0 голосов
/ 09 мая 2020

Я пытался извлечь некоторую информацию внутри этого URL: 'http://www.saude.ba.gov.br/2020/05/06/bahia-registra-4-301-casos-confirmados-e-160-obitos/' - как показано в этом фрагменте кода ниже.

запросы на импорт response = requests.get (' http://www.saude.ba.gov.br/2020/05/06/bahia-registra-4-301-casos-confirmados-e-160-obitos/ ') response.encoding =' utf-8 '# Необязательно: внутренние запросы определяют это p = response.text

Код действительно работал. Однако я обнаружил, что информация, которую я хотел извлечь, не обновлялась ежедневно в этом URL. Вместо этого он был обновлен по другому URL-адресу: 'http://www.saude.ba.gov.br/2020/05/08/bahia-registra-4-745-casos-confirmados-de-covid-19-e-170-obitos/'.

Если вы сравните URL-адрес A: http://www.saude.ba.gov.br/2020/05/06/bahia-registra-4-301-casos-confirmados-e-160-obitos/

с URL-адресом B: http://www.saude.ba.gov.br/2020/05/08/bahia-registra-4-745-casos-confirmados-de-covid-19-e-170-obitos/

вы заметите, что - 'http://www.saude.ba.gov.br/ год / месяц / день / bahia-registra- XYZKP -casos-confirmados- XXXXXXXXXXXXXXXXX /

Используя datetime, я могу получить дату доступа, но остальную часть URL-адреса, поскольку они меняются, интересно, есть способ запросить определение URL-адреса, если я поставлю "*" в конце этого существующего адреса.

...