парсинг приложения / atom + xml на html-странице - PullRequest
0 голосов
/ 30 ноября 2009

мы знаем, что все блоги показывают RSS-канал его блога

<link rel="alternate" type="application/rss+xml" title="MyBlog RSS Feed" href="http://feeds.feedburner.com/MyBlog" />

но знаете ли вы какое-нибудь регулярное выражение для получения отката от этого

<link rel="alternate" type="application/rss+xml" title="MyBlog RSS Feed" href="http://feeds.feedburner.com/MyBlog" />

1 Ответ

6 голосов
/ 30 ноября 2009

Используйте запрос XPath, как этот:

//link[@type='application/rss+xml']/@href

Он вытянет любой URL-адрес RSS-канала. Никогда не анализируйте XML или HTML с регулярными выражениями. XPath специально разработан для удобного запроса XML и HTML. Он доступен практически в каждом технологическом стеке, , включая .NET .

XML не является регулярным, и поэтому регулярное выражение является неправильным инструментом для его анализа .

...