Я думаю, что мы должны быть осторожны при выборе алгоритма хеширования в соответствии с нашим требованием, поскольку коллизии хэшей не так редки, как я ожидал. Недавно я обнаружил очень простой случай столкновения хэшей в моем проекте. Я использую оболочку Python xxhash для хеширования. Ссылка: https://github.com/ewencp/pyhashxx
s1 = 'mdsAnalysisResult105588'
s2 = 'mdsAlertCompleteResult360224'
pyhashxx.hashxx(s1) # Out: 2535747266
pyhashxx.hashxx(s2) # Out: 2535747266
Это вызвало очень сложную проблему с кэшированием в системе, а потом я обнаружил, что это коллизия хешей.