Я использовал хэш Murmur для хеширования около 800 000 строковых значений, и это вызывает много конфликтов (коллизия), то есть около 17 коллизий (разные строки дают одно и то же значение хэша), это нормально, любой знает качество хэша ропотафункция
Проверьте этот превосходный ответ на programmers.stackexhange.com , который сравнивает различные алгоритмы хеширования, включая Mumurhash2 (но не Mumurhash3), для определения скорости, коллизий и случайности.
Это сравнение хеш-функций , похоже, указывает на то, что Murmurhash генерирует примерно такое же количество коллизий, что и альтернативные хеширования в широком диапазоне входных данных.
И обратите внимание, что у Murmur 2.0 был небольшой недостаток, который был исправлен в новой версии хэша http://code.google.com/p/smhasher/