Я работаю над проектом, для которого я хочу создать облако тегов, читая индекс Lucene и сокращая его. Я не настраивал движок Lucene, это был кто-то другой в команде, теперь я просто хочу прочитать его индекс. У тебя как на Java это делается?
Не уверен, что вы подразумеваете под «чтением» индекса:
Если вы хотите сделать запрос, вы можете использовать класс IndexSearcher.
IndexReader позволяет открывать индекс в режиме чтения.
Если вы хотите просмотреть содержимое индекса, вы можете использовать Luke
Вы делаете это так -
IndexReader r = IndexReader.open( "prdb_index"); int num = r.numDocs(); for ( int i = 0; i < num; i++) { if ( ! r.isDeleted( i)) { Document d = r.document( i); System.out.println( "d=" +d); } } r.close();
вам нужно найти способ использования IndexReader класса, метод .terms () вернет вам все термины в индексе.
Просто сделайте это:
File indexDirectory = new File("YourIndexLocation"); IndexReader reader = IndexReader.open(FSDirectory.open(indexDirectory)); return reader.maxDoc(); //return total docs in index