Python 3: Beautifulsoup и кеш - PullRequest
       3

Python 3: Beautifulsoup и кеш

0 голосов
/ 22 декабря 2018

Я использую Beautifulsoup в Python3, чтобы найти строку на веб-сайте.Пока все отлично работает.Но если веб-сайт изменится, потребуется некоторое время, пока мой сценарий также обнаружит это изменение.Я предполагаю, что есть какой-то тип кеша, в чем проблема.

    URL = 'https://www.lotto.de/lotto-6aus49/lottozahlen'
    soup = BeautifulSoup(requests.get(URL).text, "lxml")
    if  not 'Samstag' in soup.find('span', class_='WinningNumbers__date').text:
      print(soup.find('span', class_='WinningNumbers__date').text)
      print('Die Samstagszahlen sind noch nicht online.')
      sys.exit()

Прав ли я в своих предположениях и как я могу изменить это поведение?

1 Ответ

0 голосов
/ 23 декабря 2018

это не имеет ничего общего с BeautifulSoup, но только с использованием requests.Из того, что я знаю, библиотека на самом деле не использует кеш по умолчанию, что может быть включено при установке внешнего пакета requests-cache.

Но в любом случае вы всегда можете использоватьCache-Control header:

requests.get(URL, headers={'Cache-Control': 'no-cache'})
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...