Я столкнулся с подобной проблемой самостоятельно 2 дня назад ( это вопрос, который я написал тогда ), и в итоге использовал Regular Expression
для извлечения необходимых данных.Я бы порекомендовал вам взглянуть на Regex
, хотя не рекомендуется анализировать HTML с Regex
.Я добавлю измененные версии Regex
, которые я получил как ответ на мой вопрос как можно скорее.
О, и вам нужно загрузить HTML-контент, если вы этого еще не сделали.
Для вашей ссылки: (ссылка будет вашей строкой HTML-тегов, я не проверял ее на всех ваших тегах, но она должна работать)
string link = "";
string patternHref = "href=\"(?:[^\"]*)\"";
string patternSrc = "src=\"(?:[^\"]*)\"";
var matches = Regex.Matches(link, patternSrc, RegexOptions.IgnoreCase);
foreach(Match ma in matches)
{
var matches2 = Regex.Matches(ma.Value, "(?! src=\")[^\"]*[^\"]*", RegexOptions.IgnoreCase);
foreach (Match ma2 in matches2)
{
if(!ma2.Value.Contains("src=") && !ma2.Value.Contains("href=") && !string.IsNullOrWhiteSpace(ma2.Value))
Console.WriteLine(ma2.Value); //assign value to variable here
}
}
Я знаю, что мойРешение не самое лучшее, но оно работало в каждом тесте, который я проводил.Не цитируйте меня об этом, я начал изучать Regex
всего несколько дней назад.