Python BeautifulSoup4 Соскоб в сети с прокси на работе - PullRequest
0 голосов
/ 14 января 2020

В настоящее время я работаю над проектом, использующим python / webscraping для сбора информации с веб-сайтов доставки. Я новичок в webscraping и следовал за учебником. К сожалению, похоже, что я не могу создать веб-страницу с моим рабочим inte rnet, получая приведенную ниже ошибку.

TimeoutError: [WinError 10060] Попытка подключения не удалась, поскольку подключенная сторона не ответила должным образом после период времени или не удалось установить соединение, так как подключенный хост не смог ответить

Однако, когда я отключился от рабочего inte rnet и точки доступа к своим телефонам, моя программа работает нормально.

Эта проблема вызвана тем, что у нас есть прокси, я не очень хорошо знаком с прокси. Есть ли способ обойти проблемы с прокси? Как я вообще узнаю, какой прокси у меня на работе? Ниже приведен мой пример кода.

from bs4 import BeautifulSoup
import urllib.request as ur

url = ur.urlopen("https://www.pythonforbeginners.com")

content = url.read()

soup = BeautifulSoup(content, 'html.parser')

print (soup.prettify())

print (title)

print (soup.title.string)

print (soup.p)

print (soup.a)
...