Как получить все HTML-теги из HTML-файла в списке с помощью регулярного выражения - PullRequest
1 голос
/ 17 сентября 2010

файл содержит тег как

<html><head></head><body><span class=style32></span>....

Мне нужен только тег html, т.е. span, head, body в списке. Не должно быть дубликатов. Пожалуйста, помогите мне, я новичок в регулярных выражениях.

1 Ответ

1 голос
/ 20 сентября 2010
var tagList = new List<string>();
                 string pattern = @"(?<=</?)([^ >/]+)"
                 var matches = Regex.Matches(file, pattern);

for (int i = 0; i < matches.Count; i++)
                 {

                     tagList.Add(matches[i].ToString());

                 }
                     //to obtain non duplicate list
                     tagList = tagList.Distinct().ToList();
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...