Обнаружение новых записей RSS-ленты - PullRequest
0 голосов
/ 05 июня 2011

Я использую feedparser для работы с RSS. Я регулярно получаю (например, каждые 15 минут) канал RSS с товарами и сохраняю их. На каналах не часто появляются какие-либо новинки. Так что это неэффективно.
Есть ли способ быстро определить, есть ли какие-то новые элементы в канале, и если нет, ничего не делать с этим каналом?

спасибо

1 Ответ

1 голос
/ 06 июня 2011

Для RSS 2.0 элемент канала имеет необязательный элемент lastBuildDate.Для atom есть аналогичный элемент «atom: updated», но в стандарте действительно говорится, что именно тогда «запись или фид были изменены так, как издатель считает значительными. Поэтому не все модификации обязательно приводят к измененному атому: updatedзначение".

В RSS 2.0 также есть элемент PubDate, также необязательный, но для него должен использоваться lastBuildDate, при условии, что он существует, и издатель использует его правильно.

Вы можете сохранить предыдущийи сравните вновь полученное значение со старым.

Добавлен материал в feedparser: Для feedparser см. Feed-updated_parsed и feed-updated.

...