Question

Я использую код VirtualStudio, и когда я печатаю page_soup, я получаю целую кучу кода html, но кажется, что в нем отсутствуют начальные строки, включая первый оператор «doctype html».

   import bs4
import urllib
from urllib.request import  urlopen as uReq
from urllib.request import Request, urlopen
from bs4 import BeautifulSoup as soup

#For sites that can't be opened due to Urllib blocker, use a Mozilla User agent to get access
pageRequest = Request('https://coronavirusbellcurve.com/', headers = {'User-Agent': 'Mozilla/5.0'})
htmlPage = urlopen(pageRequest).read()


page_soup = soup(htmlPage, 'html.parser')
print(page_soup)

Почему красивый суп не показывает первый блок кода HTML со страницы?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Почему красивый суп не показывает первый блок кода HTML со страницы?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы