RegEx не является хорошим решением для анализа неструктурированного (или неизвестного) HTML.
См. этот SO пост, по убедительным причинам, почему это так.
Iпредложить использовать синтаксический анализатор, такой как HTML Agility Pack , и запросить проанализированный документ.