Question

У меня около 10 миллионов объектов, проиндексированных с помощью NIOFSDirectory.

Когда я получаю документы с помощью MatchAllDocsQuery, производительность значительно ниже, чем у других типов запросов, таких как BooleanQuery. Я провел несколько тестов, производительность примерно в 100 раз хуже.

Поскольку в любом случае меня интересуют только первые n документов, есть ли способ получить их из объекта Searcher без использования MatchAllDocsQuery?

Я также рассматриваю возможность использования WildcardQuery со случайным свойством объекта, но Lucene в действии утверждает, что с WildcardQuery связаны "снижения производительности".

Предложения с благодарностью!

Shashikant Kore · Answer 1 · 01 мая 2009

Как отметил Ювал в комментарии, вы не указали критерии для получения лучших документов. Если вы собираетесь извлекать случайные документы, вы можете просто использовать IndexReader.document () , не проходя поиск вообще. Если у вас есть какие-то критерии, вы можете использовать TermQuery (или запрос, возвращаемый QueryParser).

Производительность Lucene: получить весь документ от Searcher

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Производительность Lucene: получить весь документ от Searcher

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов