Хорошо, у вас есть HTML, встроенный в этот XML-документ.Самое безопасное, что нужно сделать, это взять этот HTML-код и проанализировать его с помощью HTML-анализатора, такого как HTML Agility Pack , и перейти оттуда.Это не должно быть так сильно отличается.Обратите внимание, что HTML-код все еще немного закодирован, поэтому вам придется сначала его декодировать.
const string url = "http://feeds.feedburner.com/TechCrunch";
var doc = XDocument.Load(url);
var items = doc.Descendants("item");
XNamespace nsContent = "http://purl.org/rss/1.0/modules/content/";
foreach (var item in items)
{
var encodedContent = (string)item.Element(nsContent + "encoded");
var decodedContent = System.Net.WebUtility.HtmlDecode(encodedContent);
var html = new HtmlDocument();
html.LoadHtml(decodedContent);
var ps = html.DocumentNode.Descendants("p");
foreach (var p in ps)
{
var textContent = p.InnerText;
// do something with textContent
}
}
К сожалению, HTML не выглядит очень хорошо сформированным XML, поэтому вы не сможетеиспользовать LINQ to XML с этой частью.