Как получить полностью буферизированный источник веб-сайта, используя python - PullRequest
0 голосов
/ 03 февраля 2020

Я работаю над задачей очистки веб-страниц. Я использую красивый суп и urllib. Когда я собираюсь запустить код, я получаю только часть первой части сайта. Небуферизованная часть отсутствует в коде. У любого есть идея о том, как получить полностью буферизованный исходный код сайта. Я пытаюсь использовать приведенный ниже код.

import bs4 as bs
import urllib.request

source = urllib.request.urlopen('https://play.google.com/store/apps?hl=en').read()
soup = bs.BeautifulSoup(source,'lxml')

Пожалуйста, помогите, если у кого-то есть идеи по этому поводу.

...