Вы можете использовать синтаксический анализатор HTML вместо синтаксического анализатора XML, вы можете манипулировать строкой перед ее синтаксическим анализом как XML, или вы можете просто использовать регулярные выражения.Они подходят для такой ситуации.Итак, предположим, что System.Text.RegularExpressions
импортировано:
Regex metaTag = new Regex(@"<meta name=\"(.+?)\" content=\"(.+?)\">");
Dictionary<string, string> metaInformation = new Dictionary<string, string>();
foreach(Match m in metaTag.Matches(html)) {
metaInformation.Add(m.Groups[1].Value, m.Groups[2].Value);
}
Теперь вы можете просто получить доступ к любым метаданным как metaInformation["meta name"]
.