Мне любопытно найти выражение регулярного выражения C #, которое извлекает следующее:
<a id=sector href="?catid=us-58211593" >Financial</a>
... из этой строки html:
<div class="g-unit g-first">Sector: <a id=sector href="?catid=us-58211593" >Financial</a> > Industry: <a href="?catid=us-64965887" >Misc. Financial Services</a>
Текст "href ="? catid = us-58211593 "не имеет значения, поэтому он должен соответствовать элементам" a "и" id = sector ".
Update
Действительно -RegEx просто не подходит для этой работы: для достижения необходимого результата понадобилось всего 3 строки кода из HTML Agility Pack :
HtmlWeb hw = new HtmlWeb();
HtmlDocument myDoc = hw.Load("http://www.google.com/finance?q=IBM");
var etc = myDoc.GetElementbyId("sector").InnerText;