Получение обработанной javascript веб-страницы - PullRequest
0 голосов
/ 03 апреля 2011

Я запрашиваю возможность загрузки обработанной / обработанной страницы через Google Chrome или Firefox.

Например, я не хочу:

hendry@x201 ~$ w3m -dump http://hello.dabase.com
FAIL

Я хочу:

$ $answer http://hello.dabase.com
Hello World

Ответы [ 5 ]

3 голосов
/ 07 апреля 2011

Вы должны быть в состоянии сделать это, используя PhantomJS .Он работает с WebKit без визуальных элементов, но вы получаете ту же быструю и встроенную поддержку JavaScript, HTML / DOM, CSS, SVG, Canvas и многих других.

1 голос
/ 04 апреля 2011

Это похоже на проблему, которую http://simile.mit.edu/wiki/Crowbar пытается решить.

1 голос
/ 04 апреля 2011

Возможно, слишком рано, но кто-то перенес V8 на Go-lang, так что теперь вы можете написать свой собственный клиент, который использует эту мощную комбинацию:

http://bravenewmethod.wordpress.com/2011/03/30/embedding-v8-javascript-engine-and-go/

Выглядит довольно просто, не требует уродливого стека Java / Rhino и принимает следующий большой язык программирования.

0 голосов
/ 04 апреля 2011

Я бы посмотрел на Rhino .

Я бы использовал превосходную библиотеку env.js в сочетании с Rhino для симуляции среды браузера, насколько это технически возможно.После того, как вы внедрили некоторый код начальной загрузки веб-паука, вы сможете получить желаемый результат выше.

Хотя я бы заинтересовался другими решениями для этого.

0 голосов
/ 04 апреля 2011

Вы можете использовать jsdom: - https://github.com/tmpvar/jsdom

Я бы построил для него драйвер узла, но он должен работать с Rhino и т. Д.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...