регулярное выражение для определения тега привязки, который не должен быть вложенным - PullRequest
0 голосов
/ 18 августа 2010

Из источника html я должен идентифицировать тег привязки, который не должен быть вложенным.

Например:

<a href="http://www.abc.com">abc<a href="http://www.dbc.com">dbc</a>

Начиная с первого совпадения, он должен возвращать

<a href="http://www.abc.com">abc

При последующем поиске

<a href="http://www.dbc.com>dbc</a>

При поиске следует вернуться из открытого тега привязки, чтобы закрыть тег привязки, если он не вложен.Если он вложенный, он должен возвращать строку из открытого тега привязки до начала вложенного открытого тега привязки.

Пожалуйста, помогите.Заранее спасибо

1 Ответ

3 голосов
/ 18 августа 2010

Я бы предложил использовать JTidy .Несмотря на свое название, это HTML-анализатор, который будет обрабатывать все крайние случаи, которые приводят к путанице в регулярных выражениях (неудивительно, что HTML не является регулярным).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...