Читатель HTML-строки - PullRequest
       1

Читатель HTML-строки

4 голосов
/ 22 апреля 2010

Мне нужно загрузить HTML и разобрать его, я думаю, что это должно быть что-то простое, я передаю строку с «HTML», она читает строку в объекте, похожем на Dom, поэтому я могу искать и анализировать содержимое HTML, облегчающий очистку и тому подобное.

Ребята, вы знаете что-нибудь подобное?

Спасибо

Ответы [ 2 ]

13 голосов
/ 22 апреля 2010

HTML Agility Pack

Аналогично API, например, XmlDocument (со страницы примеров):

 HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

(вы также должны иметь возможностьиспользуйте LoadHtml для загрузки строки html, а не из пути)

2 голосов
/ 22 апреля 2010

Если вы работаете в браузере, вы сможете использовать HTML-мост DOM, загрузить в него HTML-код и пройтись по нему по дереву DOM.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...