Я пишу задание для Jupyter Notebook, и в основном я использую BeautifulSoup для очистки веб-страницы для получения некоторой информации (запускаю классификатор по обзорам Best Buy). Однако всякий раз, когда я пытаюсь запустить его, я получаю сообщение об ошибке тайм-аута, которое не должно происходить, потому что моя сеть и моя машина действительно все приветствуют, у меня никогда не возникало проблем с любым другим языком / программным обеспечением.
Я пытался использовать urllib и прочее, но это не сработало.
data = []
for i in range(1,250):
url = ("https://www.bestbuy.com/site/reviews/google-home-mini-charcoal/6082195?rating=1%2C2%2C3%2C4&page="+ str(i))
page = urlopen(url)
soup = BeautifulSoup(page)
x = soup.find_all("li", {"class":"review-item"})
for item in x:
author_name =item.find_all("div",attrs = {"class":"author"})[0].text
rating = item.find_all("span",attrs={"class":"c-review-average"})[0].text
review_title = item.find_all("h4",attrs={"class":"col-md-9 col-sm-9 col-xs-12 title"})[0].text
review_description = item.find_all("p",attrs={"class":"pre-white-space"})[0].text
data.append((author_name,rating, review_title,review_description ))
Я должен получить данные, которые затем разделяю, используя форму данных pandas, однако это единственный результат:
"TimeoutError: [WinError 10060] Попытка подключения не удалась, поскольку подключенная сторона не ответила должным образом через некоторое время, или не удалось установить соединение, так как подключенный хост не ответил"