Вопрос разбора строки типа HTML! - PullRequest
1 голос
/ 27 января 2011
<a href="http://www.google.com/map" class="more-link">look at the Google map</a> 

Есть ли парсер для получения ссылки (www.google.com/map) из тега <a>?

или лучший способ написать собственный ~

Ответы [ 2 ]

2 голосов
/ 27 января 2011

jQuery, например:

var href = $('a.more-link').attr('href');
0 голосов
/ 27 января 2011

Существует много сторонних решений, но я не уверен, какие существуют для Java, возможно, в версии для Java существует пакет гибкости HTML.

Но другим решением было бы использовать регулярное выражение

/<a\s+[^<]*?href\s*=\s*(?:(['"])(.+?)\1.*?|(.+?))>/

Исправлено регулярное выражение для обработки проблем, предложенных в комментариях.

Посмотрел несколько настоящих HTML-парсеров для Java, если вам нужно больше, чем regex aproach

http://htmlparser.sourceforge.net/

http://jericho.htmlparser.net/docs/index.html

http://jsoup.org/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...