Я использую python для создания приложения, которое функционирует аналогично RSS-агрегатору.Я использую библиотеку feedparser для этого.Тем не менее, я изо всех сил пытаюсь заставить программу правильно определять наличие нового контента.
В основном меня интересуют новостные ленты.Кроме того, чтобы увидеть, был ли добавлен новый элемент в канал, я также хочу иметь возможность определить, была ли обновлена предыдущая статья.Кто-нибудь знает, как я могу использовать feedparser для этого, учитывая, что единственными обязательными элементами элемента являются либо заголовок, либо описание?Я готов предположить, что элемент ссылки всегда будет присутствовать.
Атрибут «id» Feedparser, связанный с каждым элементом, кажется просто ссылкой на статью, так что это может помочь в обнаружении новых статей наканал, но не с обнаружением обновлений к предыдущим статьям, поскольку «id» для них не изменится.
Я просматривал предыдущие потоки на stackoverflow, и некоторые люди предлагали хэшировать содержимое или заголовок хэширования +url, но я не совсем уверен, что это значит или как можно поступить (если это действительно правильный подход).