2 VB RegEx Проблемы - PullRequest
       4

2 VB RegEx Проблемы

1 голос
/ 29 ноября 2010

Мне нужна помощь с VB RegEx.

У меня есть два RegEx, которые мне нужны для выполнения двух конкретных задач.

RegEx one - я не совсем уверен, как это сделатьэто, но мне нужно получить все внутри тега Href.то есть

String = "<a href=""test.html"">"

Мне нужен RegEx для возврата .... test.html

RegEx Two - у меня это частично работает.

У меня есть тегикак

RegEx = "<div class=""top""(.*?)</div>"
String = "<div class=""top""><a><b><div class=""bottom""></div></b></a></div>"

Проблема, с которой я столкнулся, заключается в том, что я ничего не возвращаю, он должен возвращать все без "top", но ничего не возвращает.

Ответы [ 2 ]

3 голосов
/ 29 ноября 2010

Ни один из вариантов использования не может быть хорошо решен с помощью регулярных выражений.

Вместо этого используйте HTML-анализатор, например, HTML Agility Pack .

0 голосов
/ 29 ноября 2010

Что ж, если ваш html не содержит вложенных тегов, вы можете выполнять первую часть с помощью регулярных выражений (если вы можете контролировать исходный код поиска, вы можете быть гораздо более уверены в своих результатах).

\<a href=""([^""]+)\>

test.html будет найден в непассивной группе , именуемой $1.

Во-вторых, я обеспокоен тем, что у вас есть вложенные теги, и это не помогает. Что касается regex и html, то regex не может хорошо вникать во вложенный, допустимый, но не лучший практический код, который может выполняться должным образом, но не правильно сформирован.

Можете ли вы опубликовать источник поиска для второго случая, чтобы мы могли посмотреть?

...