html agility pack: как извлечь необработанный текст - PullRequest
1 голос
/ 02 сентября 2011

Быстрый вопрос, как мне получить весь необработанный текст (т. Е. Удалить все теги html) с помощью html agility pack?

HtmlDocument doc = new HtmlDocument();
        doc.Load(html);

1 Ответ

3 голосов
/ 02 сентября 2011

Если вы загружаете исходный код со страницы Html Agility Pack (ищите файл " Html Agility Pack 1.4.0 Source "), существует папка Html2Txt, которая содержит необходимый код ( найдите класс HtmlToText в HtmlConvert.cs файле).

...