Я пишу программу (на Java), которая должна извлекать ссылки с веб-страниц. Я использую htmlParser (http://htmlparser.sourceforge.net/), но я могу только извлечь HTML-ссылки (определенные с <a href="...">), и я не знаю, как обрабатывать код JavaScript для извлечения ссылок из ... вы можете помочь я ??
<a href="...">
Вы можете использовать Rhino с средой DOM, написанной на JavaScript . Кстати, это написано Джоном Резигом.
Это, пожалуй, самый комплексный инструмент. Носорог . Все, что вы хотите сделать, может быть сделано с Rhino.
HTML Parser от sourceforge полезен. Я уже использовал его для разбора целой пачки HTML. Однако разбор JS отличается. Приветствия.