Как открыть RSS-каналы для данного сайта - PullRequest
2 голосов
/ 04 мая 2010

Задание задается по URL-адресу сайта (скажем, https://stackoverflow.com/), чтобы вернуть список всех каналов, доступных на сайте. Приемлемые методы:

a) использовать стороннюю службу (google ?, yahoo ?, ...) программно б) использование сканера / паука (и несколько советов о том, как настроить паука на возврат только каналов rss / xml) в) программно с использованием c / c ++ / php (любой язык / библиотека)

Задача здесь не в том, чтобы получить фиды, содержащиеся на странице, возвращаемой URL, а ВСЕХ фидах, которые доступны на сервере на любой глубине ... в любом случае, приведите простой пример использования.

1 Ответ

1 голос
/ 05 мая 2010

Единственный способ, которым я знаю об этом, это зависеть от протокола обнаружения RSS, который существует уже около 4 лет. Просканируйте сайт и посмотрите на HTML-страницах теги автообнаружения RSS:

<link rel="alternate" type="application/rss+xml" 
      title="Something" 
      href="http://www.example.com/feed1.xml” />
...