Экран Scraping Javascript на основе веб-страницы в Python - PullRequest
4 голосов
/ 18 ноября 2011

Я работаю над инструментом очистки экрана в Python. Но, просматривая источник веб-страницы, я заметил, что большая часть данных поступает через Javascript.

Есть идеи, как почистить веб-страницу на основе JavaScript? Любой инструмент в Python?

Спасибо

Ответы [ 3 ]

5 голосов
/ 18 ноября 2011

Очистка веб-страниц на основе javascript возможна при селене .В частности, попробуйте Selenium WebDriver .

4 голосов
/ 03 декабря 2011

Я использую webkit, который является браузером для Chrome и Safari. Существует привязок Python к webkit через Qt .

А вот полный пример Python для выполнения JavaScript и извлечения окончательного HTML .

3 голосов
/ 18 ноября 2011

Вы можете использовать модуль QtWebKit библиотеки PyQt4

...