Я работаю над устаревшим кодом, который создает индекс популярных терминов в другом индексе. Здесь нет модульных тестов, и процесс индексации - это сложная задача, потому что создание первого индекса занимает очень много времени.
Я хочу структурировать второй (популярный термин) индекс по-другому. Есть ли лучший способ проверить, правильно ли создается индекс Lucene?
РЕДАКТИРОВАТЬ >> По совету @ Паскаля я использую RAMDirectory, затем для проверки только что написанного индекса я настроил indexReader и перебираю результаты термина, распечатывая каждый термин, чтобы убедиться, что данные выглядят хорошо.
Код:
IndexReader reader = IndexReader.open(dir2);
TermEnum terms = reader.terms();
System.out.println("Here come the terms!");
while (terms.next()){
if (terms.term().field().equals("FULLTEXT")){
System.out.println(terms.term());
}
}
int numDocs = reader.maxDoc();
System.out.println("Number of Docs: " + numDocs);
Если индекс действительно большой, я позволю ему немного поработать, а затем просто остановлю его на полпути.
Кроме того, Люк - отличный инструмент для проверки индекса, если вы хотите быть более тщательным ... Я просто ищу что-то быстрое.
Любые другие идеи приветствуются!