Какое регулярное выражение я должен использовать, чтобы удалить ссылки из кода HTML в C #? - PullRequest
1 голос
/ 13 марта 2010

У меня есть HTML-строка, и я хочу заменить все ссылки просто текстом.

например. имеющий

Some text <a href="http://google.com/">Google</a>.

нужно получить

Some text Google.

Какое регулярное выражение я должен использовать?

Ответы [ 3 ]

2 голосов
/ 13 марта 2010

Было опубликовано несколько похожих вопросов, и лучшая практика - использовать Html Agility Pack, который создан специально для достижения подобных целей.

http://www.codeplex.com/htmlagilitypack

1 голос
/ 13 марта 2010
var html = "<a ....>some text</a>";
var ripper = new Regex("<a.*?>(?<anchortext>.*?)</a>", RegexOptions.IgnoreCase);
html = ripper.Match(html).Groups["anchortext"].Value;
//html = "some text"
1 голос
/ 13 марта 2010

Я спросил о простом регулярном выражении (спасибо Фабриану). Код будет следующим:

var html = @"Some text <a href="http://google.com/">Google</a>.";
Regex r = new Regex(@"\<a href=.*?\>");
html = r.Replace(html, "");
r = new Regex(@"\</a\>");
html = r.Replace(html, "");
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...