Разбор страницы с помощью Beautifulsoup html.parser возвращает пустой ответ - PullRequest
0 голосов
/ 07 декабря 2018

Я написал этот маленький кусочек кода.Раньше он работал нормально, но теперь возвращает пустой ответ.Я понятия не имею, почему это не работает.Я много раз менял код, а также использовал другой парсер, такой как lxml, но безрезультатно.Я новичок в кодировании в целом, так как нет никаких реальных ошибок времени выполнения, я действительно запутался.Не могли бы вы помочь мне понять, почему soup = BeautifulSoup(page_content, 'html.parser') ничего не возвращает?

Вот небольшой фрагмент кода:

import urllib3
from bs4 import BeautifulSoup

open_page = 'google.com'
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)
manager = urllib3.PoolManager(1)
page_content = manager.urlopen('GET',open_page)
print(page_content)
soup = BeautifulSoup(page_content, 'html.parser')
print(soup)

1 Ответ

0 голосов
/ 07 декабря 2018

Похоже, вы переключились с urllib2 на urllib3, у которого другой интерфейс.Ваш вызов BeautifulSoup должен быть другим:

soup = BeautifulSoup(page_content.data, 'html.parser')

, который использует .data член объекта ответа, возвращаемого url open.

...