Я использую python feedparser для анализа некоторых RSS-каналов (каждые 2 часа), к сожалению, RSS-каналы не содержат etag или измененные значения, и поэтому каждый раз, когда я анализирую каналы, я получаю все данные целиком.Я подумываю о создании хэша записей, возвращаемых из feedparser.parse, и сохранении его в базе данных, чтобы в следующий раз, когда я снова проанализирую, я мог сравнить с хешем и посмотреть, изменился ли фид, и только затем начать анализ для каждого элемента.в ленте Мои вопросы
- Есть ли другой / лучший способ узнать, обновился ли RSS-канал
Как создать хэш?Достаточно ли просто сделать следующее
import hashlib
hash_object = hashlib.sha256(<FEEDPARSER_RESPONSE>)
hex_dig = hash_object.hexdigest()
Сохранить hex_dig в базе данных