По сути, это дверь для оптимизации производительности хеширования. Производительность хэширования сильно зависит как от используемого алгоритма хеширования, так и от данных, с которыми вы работаете, поэтому практически невозможно придумать правило. Во всяком случае, что-то можно сказать.
Вы знаете, что каждая структура данных предлагает определенный баланс между пространственной и временной эффективностью. Хеш-таблицы особенно хороши с точки зрения эффективности времени, предлагая привлекательный постоянный (0 (1)) доступ к времени.
Это верно, если нет столкновения. Когда происходит столкновение, тогда время доступа является линейным с размером сегмента, соответствующего значению столкновения. (Посмотрите на это для более подробной информации). Столкновения, помимо того, что они «медленнее», в основном нарушают гарантию времени доступа, которая является единственным наиболее важным аспектом, который часто приводит к выбору хеш-таблицы.
В идеале хеш-таблицы могут быть нацелены на то, что известно как «идеальное хеширование» (что на самом деле выполнимо, только если вы можете точно настроить алгоритм в соответствии с типом данных, которые вы будете обрабатывать), но это не так легко достичь в общем случае (на самом деле это эвфемизм). В любом случае, на самом деле большие хеш-таблицы (вместе с хорошим алгоритмом хеширования) могут снизить частоту коллизий и, следовательно, повысить производительность за счет памяти. Меньшие хеш-таблицы будут видеть больше коллизий (следовательно, будут иметь меньшую производительность и меньшую гарантию времени доступа к качеству), но занимают меньше памяти.
Итак, если вы профилируете свою программу и видите, что доступ к хеш-таблице является узким местом (по любым причинам), у вас есть шанс решить эту проблему, зарезервировав больше памяти для хеш-пространства (если у вас есть память, которую можно выделить).
В любом случае я бы не увеличивал это значение случайным образом, а только после тщательного профилирования, поскольку верно также и то, что используемый Perl алгоритм компилируется в (AFAIK), и это также оказывает большое влияние на производительность хеширования (в другими словами, вы можете столкнуться с множеством коллизий, даже если увеличите размер хеша).
Как обычно с вещами, связанными с производительностью, это может быть полезно или нет, это зависит от вашего конкретного случая.