Я пытаюсь извлечь URL-ссылку, заголовок и время из html-страницы, в частности из класса commentList, и поместить ее в список.Как я могу добиться этого?
Это HTML-страница:
<div class="filter-Holder">
<div class="list">
<ul class="commentList">
<li>
<div class="time">19:45</div>
<h5>
<a href="https://urlLink.com" class="title">textTitle</a>
</h5>
Это мой код, таким образом:
var url = "https://www.url.com/";
var webGet = new HtmlWeb();
var document = webGet.Load(url);
string urllink = document.DocumentNode.SelectNodes("//*
[@id='content']/div[4]/div/div/div/ul")[0].InnerText;
foreach (var i in urllink)
{
Console.Write(i);
}
var linksOnPage = from
lnks in document.DocumentNode.Descendants()
where
lnks.Name == "a" &&
lnks.Attributes["href"] != null &&
lnks.InnerText.Trim().Length > 0
select new
{
Url = lnks.Attributes["href"].Value,
Text = lnks.InnerText,
};