Регулярное выражение, чтобы изолировать текст от образца HTML? - PullRequest
0 голосов
/ 16 июня 2011

Мне любопытно найти выражение регулярного выражения C #, которое извлекает следующее:

<a id=sector href="?catid=us-58211593" >Financial</a>

... из этой строки html:

<div class="g-unit g-first">Sector: <a id=sector href="?catid=us-58211593" >Financial</a> &gt; Industry: <a href="?catid=us-64965887" >Misc. Financial Services</a> 

Текст "href ="? catid = us-58211593 "не имеет значения, поэтому он должен соответствовать элементам" a "и" id = sector ".

Update

Действительно -RegEx просто не подходит для этой работы: для достижения необходимого результата понадобилось всего 3 строки кода из HTML Agility Pack :

HtmlWeb hw = new HtmlWeb();
HtmlDocument myDoc = hw.Load("http://www.google.com/finance?q=IBM");
var etc = myDoc.GetElementbyId("sector").InnerText;

1 Ответ

3 голосов
/ 16 июня 2011
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...