У меня есть строка, которая должна содержать список элементов в форме, {0}, {1} и {2} являются строками, и я хочу в основном извлечь их.
Я хочу сделать это для решения проблемы синтаксического анализа html, и я слышал, что синтаксический анализ html с регулярными выражениями - это плохо. (Вроде здесь )
Я даже не уверен, как это сделать с помощью регулярных выражений.
Это насколько я получил
string format = "<link rel=\".*\" type=\".*\" href=\".*\">";
Regex reg = new Regex(format);
MatchCollection matches = reg.Matches(input, 0);
foreach (Match match in matches)
{
string rel = string.Empty;
string type = string.Empty;
string href = string.Empty;
//not sure what to do here to get these values for each from the match
}
До того, как мои исследования выяснились, я мог быть совершенно не на своем пути, используя регулярные выражения.
Как бы вы сделали это с помощью выбранного мной метода или с помощью парсера HTML?