Как предлагают сотни других ответов на stackoverflow - плохая идея использовать регулярные выражения для обработки html.используйте какой-нибудь html-парсер.
Но, например, если вам все еще нужно регулярное выражение для поиска URL-адресов href, ниже приведено регулярное выражение, которое можно использовать для сопоставления hrefs и извлечения его значения:
\b(?<=(href="))[^"]*?(?=")
Если вы хотитеполучить содержимое внутри <A>
и </A>
, тогда использование регулярных выражений - действительно плохой подход, так как заглядывание / отставание в регулярном выражении не поддерживает регулярное выражение, создающее совпадения переменной длины.