Как удалить все теги <a></a> из большой строки HTML в C #? - PullRequest
2 голосов
/ 10 декабря 2010

У меня есть большая строка HTML, которую я проанализировал с кучей уже сформированных ссылок в ней. Я ищу быстрый способ избавиться от всех ссылок, чтобы отобразить только текст. Любая помощь или предложения приветствуются!

Пример строки HTML выглядит следующим образом:

<A href="test.com">myText</A>, <A href="test1.com">myText</A>, <A href="test2.com">myText</A>, <A href="differenttesturl.com">myText</A>, <A href="test0.com">myText</A>

Я хочу, чтобы HTML выглядел следующим образом:

myText, myText, myText, myText, myText

Я использую C # на странице ASP.NET, и HTML хранится в виде STRING,

Спасибо.

Ответы [ 3 ]

4 голосов
/ 10 декабря 2010

Вот простое решение для удаления тегов HTML из строки с помощью регулярных выражений.

http://www.osherove.com/blog/2003/5/13/strip-html-tags-from-a-string-using-regular-expressions.html

1 голос
/ 10 декабря 2010

Вы хотите использовать для этого HTML-парсер.

См. Этот пост для некоторых вариантов

Требуется синтаксический анализатор C # HTML

1 голос
/ 10 декабря 2010

Вы можете превратить его в документ XML и извлечь все текстовые узлы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...