Вырвать подстроку из тегов HTML с помощью JAVA - PullRequest
1 голос
/ 16 мая 2010

скажем, у меня есть строка типа "neverMind<b>What is up</b>neverMind", и я хочу вынести то, что происходит, используя регулярное выражение с JAVA. Кто-то сказал мне, что использование matcher будет лучшим. Может кто-нибудь показать мне, как это сделать с помощью Matcher?
Другие решения также приветствуются! Спасибо!

1 Ответ

5 голосов
/ 16 мая 2010

Если ваша строка всегда так проста, вы можете использовать java Pattern. Но если ваши строки усложняются и вы хотите извлечь содержимое из вложенных структур, вам действительно следует использовать анализатор HTML.

Для выбора правильного анализатора посмотрите на этот вопрос: Какой HTML-анализатор лучше всего .

Если вы останетесь с шаблонами, ваше регулярное выражение будет выглядеть так:

Pattern pattern = Pattern.compile( "<b>(.*?)</b>" );
Matcher m = pattern.matcher( "neverMind<b>What is up</b>neverMind" );
if( m.find() ) {
    String theStringYouAreLookingFor = m.group( 1 );
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...