Как бы я использовал регулярное выражение для анализа следующего:
<b>HelloWorld</b>
<p>This is a test</p>
<a href="myUrl">Google</a>
Необходимо удалить все HTML-теги, а URL-адреса извлечь из тегов гиперссылок, и результат должен быть:
HelloWorld
This is a test
myUrl