Часть приложения, которое я создаю, должна проверять RSS-каналы на наличие обновлений. Я ищу надежный способ узнать, есть ли в ленте новые записи.
Я знаю, что иногда люди пишут в будущее, а после этого пишут в настоящее время, что может привести к тому, что некоторые записи будут скрыты. Кажется, что и здесь может быть больше осложнений. Я также знаю, что хэширование заголовка или содержимого может привести к снижению производительности и ненадежным результатам, поскольку они могут измениться и не являются признаком новых записей. И я знаю, что несколько лет назад, когда я вручную поддерживал RSS-канал подкаста, я никогда не менял этот элемент.
Итак, мне нужен какой-то способ надежной проверки каналов RSS, Atom и т. Д. Для новых записей, так как они были проверены.
В частности, это приложение будет написано на Python для Google App Engine с использованием Universal Feed Parser , но я сомневаюсь, что в этом случае это имеет слишком большое значение.