Как разобрать JavaScript для ссылок с Java? - PullRequest
0 голосов
/ 11 августа 2009

Я пишу программу (на Java), которая должна извлекать ссылки с веб-страниц. Я использую htmlParser (http://htmlparser.sourceforge.net/), но я могу только извлечь HTML-ссылки (определенные с <a href="...">), и я не знаю, как обрабатывать код JavaScript для извлечения ссылок из ... вы можете помочь я ??

Ответы [ 3 ]

2 голосов
/ 11 августа 2009

Вы можете использовать Rhino с средой DOM, написанной на JavaScript .
Кстати, это написано Джоном Резигом.

0 голосов
/ 02 июля 2012

Это, пожалуй, самый комплексный инструмент. Носорог . Все, что вы хотите сделать, может быть сделано с Rhino.

0 голосов
/ 05 июля 2011

HTML Parser от sourceforge полезен. Я уже использовал его для разбора целой пачки HTML. Однако разбор JS отличается. Приветствия.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...