Поскольку здесь нет исчерпывающего ответа, я его напишу.
Чтобы соскрести JS-страницы, нам понадобится браузер с движком JavaScript (например, поддержка рендеринга JavaScript)
Такие параметры, как Механизация , url2lib не будут работать, поскольку они НЕ поддерживают JavaScript.
Итак, вот что вы делаете:
Настройка PhantomJS для работы с Селен . После установки зависимостей для них обоих (см. this ), вы можете использовать следующий код в качестве примера для получения полностью визуализированного веб-сайта.
from selenium import webdriver
driver = webdriver.PhantomJS()
driver.get('http://jokes.cc.com/')
soupFromJokesCC = BeautifulSoup(driver.page_source) #page_source fetches page after rendering is complete
driver.save_screenshot('screen.png') # save a screenshot to disk
driver.quit()