Я индексирую около 100 миллионов документов, которые состоят из нескольких строковых идентификаторов и примерно сотни числовых терминов. Я не буду выполнять диапазонные запросы, поэтому я не копался слишком глубоко в Numaric Field, но я не думая, что это правильно, выберите здесь.
Моя проблема заключается в том, что производительность запроса быстро снижается, когда я начинаю добавлять критерии OR к своему запросу. Все мои запросы имеют конкретные числовые термины. Таким образом, документ выглядит как StringField: [someString] и N DataField: [someNumber] .. Затем я запрашиваю что-то вроде DataField: ((+ 1 + (2 3)) (+75 + (3 5 52)) (+99 +88 + (102 155 199))).
В настоящее время выполнение этих запросов на моем ноутбуке занимает от 7 до 16 секунд. Я хотел бы убедиться, что это действительно лучшее, что они могут сделать. Я открыт для предложений по структуре полей и структуре запросов: -).
Спасибо
Josh
PS: Я уже перечитал все другие обсуждения производительности люцена здесь, а также на вики Lucene и при ясном воображении ... Я чуть дальше по кроличьей норе, что ...