В настоящее время я использую сочетание urllib2, pyquery и json для очистки сайта, и теперь я обнаружил, что мне нужно извлечь некоторые данные из JavaScript.Одна мысль - использовать движок JavaScript (например, V8), но это кажется излишним для того, что мне нужно.Я бы использовал регулярные выражения, но выражение для этого кажется слишком сложным.
JavaScript:
(function(){DOM.appendContent(this, HTML("<html>"));;})
Мне нужно извлечь <html>
, но я не совсем уверен, каксделать это.* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * <html>
* * * * * * * * * * * * *] * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *1007* * * * * * * * * * * * * * * * * 1