Я использую BeautifulSoup для извлечения данных из боковых панелей Reddit по выбору подредактов, но мои результаты меняются почти каждый раз, когда я запускаю свой скрипт.
В частности, результаты в sidebar_urls
меняютсяот итерации к итерации;иногда это приводит к [XYZ.com/abc, XYZ.com/def]
, иногда оно возвращает просто [XYZ.com/def]
, и, наконец, иногда возвращается []
.
Есть идеи, почему это может происходить с использованием приведенного ниже кода?
sidebar_urls = []
for i in range(0, len(reddit_urls)):
req = urllib.request.Request(reddit_urls[i], headers=headers)
resp = urllib.request.urlopen(req)
soup = BeautifulSoup(resp, 'html.parser')
links = soup.find_all(href=True)
for link in links:
if "XYZ.com" in str(link['href']):
sidebar_urls.append(link['href'])