Лучше всего было бы просто перенести алгоритм хеширования в массив целых чисел и подсчитать, сколько раз попадет каждая корзина хеш-данных с учетом реальных данных. (Я предлагаю вывести STL из уравнения здесь, на самом деле.)
Если вы в конечном итоге видите большие отклонения в своих счетах с большими наборами реальных данных, ваш алгоритм хеширования генерирует множество коллизий, когда доступно много пустых (или более пустых) блоков.
Обратите внимание, что «высокое отклонение» является относительным термином. Хороший алгоритм хеширования - это детерминированный случайный процесс, и любой случайный процесс может дать странные результаты, поэтому тестируйте его часто, хорошо тестируйте и, где это возможно, используйте вашу фактическую проблемную область в качестве источника ваших тестов и элементов управления.