Как сайты извлекают "новые" элементы из RSS-каналов - PullRequest
2 голосов
/ 01 ноября 2010

Допустим, я хочу разобрать Sherdog новостные ленты. Это единственный способ получить их путем анализа общедоступных файлов XML? Разве не существует какой-либо службы, которая имеет сайты, которые "выталкивают" контент на ваш сервер?

У меня сложилось впечатление, что обычный способ сделать это - настроить задание cron, которое скажет, что каждые 10 минут переходит на страницу типа this и вставляет элементы в базу данных, если они уже там.

Это так? Если нет, может ли кто-нибудь научить меня?

1 Ответ

2 голосов
/ 01 ноября 2010

Да, опрос RSS-каналов является стандартом де-факто. Устройства чтения RSS и серверы должны поддерживать механизмы кэширования (наиболее важные условные HTTP-запросы HTTP), чтобы сделать это эффективным.

Новым подходом к избавлению от опроса является PubSubHubub , который действительно отправляет уведомления подписчикам.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...