Я пытался извлечь некоторую информацию внутри этого URL: 'http://www.saude.ba.gov.br/2020/05/06/bahia-registra-4-301-casos-confirmados-e-160-obitos/' - как показано в этом фрагменте кода ниже.
запросы на импорт response = requests.get (' http://www.saude.ba.gov.br/2020/05/06/bahia-registra-4-301-casos-confirmados-e-160-obitos/ ') response.encoding =' utf-8 '# Необязательно: внутренние запросы определяют это p = response.text
Код действительно работал. Однако я обнаружил, что информация, которую я хотел извлечь, не обновлялась ежедневно в этом URL. Вместо этого он был обновлен по другому URL-адресу: 'http://www.saude.ba.gov.br/2020/05/08/bahia-registra-4-745-casos-confirmados-de-covid-19-e-170-obitos/'.
Если вы сравните URL-адрес A: http://www.saude.ba.gov.br/2020/05/06/bahia-registra-4-301-casos-confirmados-e-160-obitos/
с URL-адресом B: http://www.saude.ba.gov.br/2020/05/08/bahia-registra-4-745-casos-confirmados-de-covid-19-e-170-obitos/
вы заметите, что - 'http://www.saude.ba.gov.br/ год / месяц / день / bahia-registra- XYZKP -casos-confirmados- XXXXXXXXXXXXXXXXX /
Используя datetime, я могу получить дату доступа, но остальную часть URL-адреса, поскольку они меняются, интересно, есть способ запросить определение URL-адреса, если я поставлю "*" в конце этого существующего адреса.