У меня есть пара вопросов о схеме индекса Lucene / SOLR
Вот мое поле идентификатора документа (UniqueKey), как определено в схеме SOLR:
Я никогда не буду выполнять поиск по полю Id, поэтому нужно ли его индексировать = "true"? И кстати, нужно ли его хранить = "true" (я предполагаю, что оно будет сохранено в любом случае, так что это не имеет значения).
И 2: какое максимальное количество документов может храниться в одном индексе SOLR? Или, если быть более точным: в нем может храниться 5 миллиардов небольших документов?
Третий вопрос: мне нужно выполнить поиск по комбинации из 2 полей: одно типа long и одно целое. Каков наиболее эффективный способ хранения и индексации таких полей - хранить и индексировать их по отдельности или предварительно вычислять какое-то хеш-значение на основе их обоих и выполнять поиск только по хешу? Поскольку я хочу иметь несколько миллиардов таких документов, мне нужно минимизировать потребности в хранилище при сохранении эффективности поиска.
Спасибо
RG