Поиск строки, исключая HTML-теги - PullRequest
1 голос
/ 20 февраля 2010

Можно ли получить строку без тегов html, которые будут отображаться в элементе управления веб-браузера?

Как у меня есть String str = "html hello html", тогда я хочу найти строку как hello.

Как я могу это сделать?

Ответы [ 2 ]

2 голосов
/ 20 февраля 2010

Регулярные выражения не идеальны для HTML. Регулярные выражения для обычного текста, а не HTML.

Используйте библиотеку HTML-анализатора, такую ​​как бесплатный открытый исходный код HTML Agility Pack . Он поставляется в комплекте с примером преобразования HTML-в-текст .

1 голос
/ 20 февраля 2010

Вы можете использовать регулярное выражение для удаления HTML-тегов, например:

string html = "Your html string";
string x = Regex.Replace(html,@"<(.|\n)*?>", string.Empty);
...