Java регулярное выражение для получения IMG SRC - PullRequest
0 голосов
/ 17 сентября 2011

Я пытаюсь получить данные со страницы html.Эти данные являются ссылкой на изображение.Страница всегда имеет разный контент, поэтому единственный способ - использовать регулярные выражения.На странице только одно совпадение со следующим стилем

<img src="imglink" alt="texttext textex" style="border:1px solid #FFFFFF"/>

Что я использую для получения imglink

"<img src=\"(.*)\""

Есть ли что-то, чего я не знаю об использовании регулярного выражения?Я должен быть легким, как пирог, но он получит весь текст после <и до />

Ответы [ 2 ]

3 голосов
/ 17 сентября 2011

Попробуйте использовать нежадную версию

"<img src=\"(.*?)\""

, чтобы сопоставить как можно меньше символов.

Обратите внимание: используйте регулярные выражения только для обработки html или xml, еслиу вас есть простая структура текста, которая известна.Для произвольного htlm / xml не используйте регулярные выражения.

2 голосов
/ 17 сентября 2011

Как правило, при попытке выбрать символы между разделителями, я ставлю точку, чтобы поместить «следующий ожидаемый символ разделителя» в предложение выбора вместо «.».

Так что в этом случае:

"<img src=\"([^\"]*)\""
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...