Инструменты проверки индекса для Lucene - PullRequest
1 голос
/ 16 ноября 2010

Как мы можем знать, что индекс в Lucene правильный?

Деталь

Я создал простую программу, которая создала индексы Lucene и сохранила ее в папке. Используя диагностический инструмент, Люк Я мог заглянуть внутрь индекса и просмотреть содержимое.

Я понимаю, что Lucene - это стандартная структура для создания поисковой системы, но я хотел быть уверен, что Lucene индексирует каждый термин, который существовал в файле.

Можно ли проверить, что создание индекса Lucene надежно? Что не пропал ни один термин?

1 Ответ

3 голосов
/ 16 ноября 2010

Вы всегда можете создать небольшую программу, которая будет выполнять тот же анализ , который вы используете при индексации своего контента.Затем для всех терминов запросите свой индекс, чтобы убедиться, что документ входит в число результатов.Повторите для всего содержимого.Но лично я бы не стал тратить на это время.Если вы можете открыть свой индекс в Luke и сделать пару запросов, то, скорее всего, все в порядке.

Часто реальный вопрос состоит в том, подойдет ли вам анализ контента, который вы провели,запросы, которые будут сделаны к вашему индексу.Вы должны убедиться, что ваш индекс будет иметь хороший баланс между отзывом и точностью .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...