Выберите часть InnerText, используя HtmlAgilityPack - PullRequest
0 голосов
/ 12 мая 2011

Как выбрать часть InnerText с помощью HtmlAgilityPack, например:

<td class="playerName" width="192">
  <a href="/cricket/content/player/21585.html">player1</a>* 
</td>

Теперь я хочу выбрать 21585 из атрибута href.

1 Ответ

3 голосов
/ 12 мая 2011

Вы можете попасть на HREF с XPATH и кодом, например,

    HtmlDocument doc = new HtmlDocument();
    doc.Load(myHtmlFilePath);
    // get to the A tag using XPATH
    HtmlNode a = doc.DocumentNode.SelectSingleNode("//td[@class='playerName']/a");
    // get the HREF attribute
    string href = a.GetAttributeValue("href", null);

, но не дальше.Вам придется разобрать href вручную, вот быстрый взлом, который работает с вашим примером:

    Uri uri = new Uri(@"dummy:" + href); // use whatever "drive-like" root
    Console.WriteLine(Path.GetFileNameWithoutExtension(uri.LocalPath));
...