Поскольку они заполняются и процент ложных срабатываний увеличивается, какие методы используются для предотвращения их насыщения? Похоже, вы не можете очистить биты, так как это сразу же отрицательно скажется на данных, хранящихся в этом узле.
Даже если у вас есть набор известного размера, в хранилище данных, использующем фильтры Блума, такие как Cassandra, меня смущает то, что данные в узле будут добавляться и удаляться, верно? Но когда вы удаляете ключ, вы не можете установить для его блоков фильтра Блума значение 0, так как это может создать ложный отрицательный результат для данных в узле, который хэширует одно или несколько таких же сегментов, что и удаленный ключ. Так что со временем фильтр как бы заполняется