Почему красивый суп не показывает первый блок кода HTML со страницы? - PullRequest
0 голосов
/ 08 мая 2020

Я использую код VirtualStudio, и когда я печатаю page_soup, я получаю целую кучу кода html, но кажется, что в нем отсутствуют начальные строки, включая первый оператор «doctype html».

   import bs4
import urllib
from urllib.request import  urlopen as uReq
from urllib.request import Request, urlopen
from bs4 import BeautifulSoup as soup

#For sites that can't be opened due to Urllib blocker, use a Mozilla User agent to get access
pageRequest = Request('https://coronavirusbellcurve.com/', headers = {'User-Agent': 'Mozilla/5.0'})
htmlPage = urlopen(pageRequest).read()


page_soup = soup(htmlPage, 'html.parser')
print(page_soup)
...