Как проанализировать разметку веб-страницы после обработки JavaScript в сценарии / из CLI? - PullRequest
1 голос
/ 19 августа 2011

Я искал стандартную практику для анализа разметки веб-страницы после обработки javascript внутри скрипта или из командной строки, т. Е. Без какого-либо браузера?

Это должно происходить в среде Linux. Являются ли они «устанавливаемыми», которые позволят вам передавать разметку HTML, включая javascript, и будут возвращать разметку после имитации стандартного запроса браузера и выполнения всех вызовов Javascript?

Если есть какие-либо Perl-модули, о которых вы можете подумать, это может быть даже более полезным.

Я смотрел на https://developer.mozilla.org/en/SpiderMonkey и http://search.cpan.org/~mschilli/JavaScript-SpiderMonkey-0.12/SpiderMonkey.pm, но я не уверен, что это позволило бы мне передать полный HTML-документ и получить обработанную версию со всеми манипуляциями DOM javascript?

Пожалуйста, дайте мне знать.

Обновление , я понял

Я все понял - вот что нужно сделать:

#!/usr/bin/perl

use WWW::Scripter;
$w = new WWW::Scripter;

$w->use_plugin('JavaScript');
$w->get('http://www.google.com');
print $w->content(),"\n";

Ответы [ 2 ]

2 голосов
/ 19 августа 2011

Вы должны использовать браузер, новый как WWW :: Scripter :: Plugin :: Javascript или старый как WWW :: Mechanize :: Firefox

0 голосов
/ 19 августа 2011

Может быть, решение может быть без браузера, как PhantomJS .Не Perl-модуль, но очень практичный для внешнего тестирования и автоматизации.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...