Java: найти RSS-файл (ы) веб-сайта - PullRequest
2 голосов
/ 29 сентября 2011

Я пишу Java-приложение; используя Rome lib для чтения RSS-каналов RSS-файла веб-сайта. Я могу читать и управлять фидами, используя Рим, но не могу найти точный URL-путь к файлу RSS. Я знаю, что в html-файле есть такая строка, указывающая URL-адрес XML-файла RSS:

<link rel="alternate" type="application/rss+xml" href="/rss.ashx" title="Rss feed for yourdomain.com" />

Что такое чистый способ найти файл RSS, URL-путь в Java?

спасибо всем

1 Ответ

3 голосов
/ 29 сентября 2011

Вы можете использовать выражение xpath на html-странице, чтобы получить <link /> -Node и извлечь атрибут href.Из коробки это будет работать только на хорошо оформленных страницах XHTML.Возможно, вам нужно исправить документ перед применением xpath.

Или вы используете что-то вроде http://jsoup.org/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...