раздеть HTML и CSS в C # - PullRequest
       2

раздеть HTML и CSS в C #

4 голосов
/ 31 марта 2011

Я создаю письма в одном из моих решений, и мне нужно предоставить как html, так и текстовые сообщения с заданной html страницы.

Однако я не нашел по-настоящему хорошего способа убрать html, js и css из любого HTML-шаблона, который могут предоставить клиенты.

Есть ли какое-то простое решение для этого, возможно, компонент, который обрабатывает все это, или мне нужно начать головоломку с регулярным выражением? И возможно ли даже создать пуленепробиваемое регулярное выражение для всех возможных тегов?

Привет

Ответы [ 5 ]

8 голосов
/ 31 марта 2011

Дайте HtmlAgilityPack .У него есть методы для извлечения текста из документа HTML.

Вам просто нужно сделать следующее:

  var doc = new HtmlDocument();
  doc.LoadHtml(htmlStr);
  var node = doc.DocumentNode;
  var textContent = node.InnerText;
1 голос
/ 31 марта 2011

Посмотрите здесь: Анализ HTMLAgilityPack в InnerHTML .Есть ответ, как это сделать с помощью Html Agility Pack

1 голос
/ 31 марта 2011

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * - полезный для вас случай.

1 голос
/ 31 марта 2011

Как компонент, который может раздеть html: Html Agility Pack

0 голосов
/ 05 декабря 2011

На этой странице вы можете найти очень быстрый алгоритм удаления HTML из строкового ввода. Хотя с недопустимым HTML есть некоторые проблемы, он по-прежнему отличный ресурс http://www.dotnetperls.com/remove-html-tags

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...