Прямо сейчас мои хеш-таблицы подсчитывают количество каждого элемента, вставленного в хеш-таблицу. Я использую этот счет с общим размером хеш-таблицы, чтобы вычислить коэффициент загрузки, и когда он достигает 70%, я перефразирую его.
Я подумал, что, возможно, мне следует считать только вставленные элементы с заполнением пустого слота вместо всех. Потому что метод столкновения, который я использую, это отдельная цепочка. Коэффициент загрузки продолжает увеличиваться, но если может быть несколько столкновений, остается много пустых слотов в хэш-таблице.
Вы, вероятно, думаете, что если у меня так много коллизий, возможно, я не использую лучший метод хеширования. Но дело не в этом, я использую один из известных алгоритмов хеширования, я протестировал 3 из них на моих выборочных данных и выбрал тот, который вызывал меньше коллизий.
Мой вопрос все еще остается. Должен ли я продолжать считать каждый вставленный элемент или только те, которые заполняют пустой слот в хэш-таблице?