Я сканирую страницу www.thenextweb.com
Я хочу извлечь все ссылки на посты, содержание статьи, изображение статьи и т. Д.
Я написал этот код ...
string url = TextBox1.Text.ToString();
var webGet = new HtmlWeb();
var document = webGet.Load(url);
var infos = from info in document.DocumentNode.SelectNodes("//div[@class='article-listing']")
select new
{
Contr = info.InnerHtml
};
lvLinks.DataSource = infos;
lvLinks.DataBind();
Это извлекает всю необходимую информацию со страницы ... и я использовал эту информацию на домашней странице, используя элемент управления listview на странице asp.net, как
<li> <%# Eval("Contr") %> </li>
Теперь что яхочу - это способ, которым я могу извлечь информацию об узлах, так как у нас есть все узлы, присутствующие в информация URL ссылки, текст сообщения и т. д.
Я хочу способ, чтобы я могхранить их как URL [0], PostContent [0], PostImage [0], Date [0] и URL [1], PostContent [1] и т. д. Все они содержат уважаемые значения, которые хранятся в этих строках массива ....одно за другим каждое сообщение ...
Это как извлечение информации один за другим из внутренних узлов в информации.
Пожалуйста, предложите способ?