Мне нужно хранить, индексировать и находить много SHA1-токенов в Solr.
Теперь я храню их как 40-символьные шестнадцатеричные строки, такие как 68ac906495480a3404beee4874ed853a037a7a8f
.В моем индексе Solr содержится около 10 000+ уникальных токенов SHA1.
Было бы лучше хранить значения, сжатые как 20-байтовое BinaryField?(половинный индекс, больше производительности ...?)
Я прочитал о Krugle в книге "Lucene in action", в которой хранится всего несколько символовв середине (сжатых) MD5-струн.Было бы лучше получить максимальную производительность поиска?