Я знаю, что в Интернете, как и в SO, есть несколько тем, касающихся индексации и производительности запросов в Lucene, но мне еще предстоит найти тему, в которой обсуждается, стоит ли (и если да, то сколько) создание полезных нагрузок. повлияет на производительность запроса ...
Вот сценарий ...
Допустим, я хочу проиндексировать коллекцию документов (где-то от 100K до 10M), и у каждого документа есть подраздел, который я хочу иметь возможность искать отдельно (или, возможно, ранжировать выше, в зависимости от того, было ли найдено соответствие этот раздел).
Я рассматриваю возможность добавления полезной нагрузки (во время индексации) к любому термину, который появляется в этом подразделе, чтобы я мог эффективно сделать это определение во время запроса.
Кто-нибудь знает о каких-либо проблемах производительности, связанных с использованием полезных нагрузок, или даже лучше, не могли бы вы указать мне какую-либо онлайн-документацию по этой теме?
Спасибо!
РЕДАКТИРОВАТЬ: Я ценю альтернативные решения для моего сценария, но в случае, если мне нужно будет использовать полезные нагрузки в будущем, есть ли у кого-нибудь какие-либо комментарии относительно первоначального вопроса о производительности запроса?