Solr: хранить SHA1-хэши эффективно - PullRequest
0 голосов
/ 11 октября 2011

Мне нужно хранить, индексировать и находить много SHA1-токенов в Solr.

Теперь я храню их как 40-символьные шестнадцатеричные строки, такие как 68ac906495480a3404beee4874ed853a037a7a8f.В моем индексе Solr содержится около 10 000+ уникальных токенов SHA1.

Было бы лучше хранить значения, сжатые как 20-байтовое BinaryField?(половинный индекс, больше производительности ...?)

Я прочитал о Krugle в книге "Lucene in action", в которой хранится всего несколько символовв середине (сжатых) MD5-струн.Было бы лучше получить максимальную производительность поиска?

...