Это не столько конкретная проблема, сколько то, на что я ищу больше философского ответа "Pythonic".А именно, каков наилучший способ отслеживать уникальные элементы и не допускать появления дубликатов?
Например, я пишу сценарий для очистки веб-сайта для ссылок на песни в SoundCloud, чтобы я мог автоматически загружать их,Если я хочу автоматизировать эту программу, скажем, с помощью cron
, какой самый эффективный способ обеспечить загрузку только того содержимого, которого у меня уже нет?
Или, если я загружал изображения, как я могубедитесь, что нет никаких дубликатов, или есть какой-то процесс, который эффективно ищет и удаляет дубликаты?
Вид с открытым исходным кодом, поэтому вносите столько, сколько хотите.
Спасибо.