Юнит тест для индексов Lucene - PullRequest
2 голосов
/ 29 июня 2010

Я работаю над устаревшим кодом, который создает индекс популярных терминов в другом индексе. Здесь нет модульных тестов, и процесс индексации - это сложная задача, потому что создание первого индекса занимает очень много времени.

Я хочу структурировать второй (популярный термин) индекс по-другому. Есть ли лучший способ проверить, правильно ли создается индекс Lucene?

РЕДАКТИРОВАТЬ >> По совету @ Паскаля я использую RAMDirectory, затем для проверки только что написанного индекса я настроил indexReader и перебираю результаты термина, распечатывая каждый термин, чтобы убедиться, что данные выглядят хорошо.

Код:

IndexReader reader = IndexReader.open(dir2);
TermEnum terms = reader.terms();
System.out.println("Here come the terms!");
while (terms.next()){
    if (terms.term().field().equals("FULLTEXT")){
        System.out.println(terms.term());
    }
}
int numDocs = reader.maxDoc();
System.out.println("Number of Docs: " + numDocs);

Если индекс действительно большой, я позволю ему немного поработать, а затем просто остановлю его на полпути.

Кроме того, Люк - отличный инструмент для проверки индекса, если вы хотите быть более тщательным ... Я просто ищу что-то быстрое.

Любые другие идеи приветствуются!

1 Ответ

3 голосов
/ 29 июня 2010

При модульном тестировании индекса Lucene я часто использую RAMDirectory, поскольку он быстро собирается.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...