Lucene Поиск с и состояние - PullRequest

Lucene Поиск с и состояние

0 голосов
/ 16 октября 2018

Я пытаюсь создать отдельное Java-приложение в Lucene, чтобы найти текст из файла XML.Ниже приведен пример XML-файла, который я получаю:


Ниже приведен код для индексатора:

public class SimpleFileIndexer {
    public static void main(String[] args) throws Exception {
        File indexDir = new File("<path of the index directory>");
        File dataDir = new File("<path of the data directory>");
        String suffix = "txt";
        SimpleFileIndexer indexer = new SimpleFileIndexer();
        int numIndex = indexer.index(indexDir, dataDir, suffix);
        System.out.println("Numer of total files indexed:  " + numIndex);

    private int index(File indexDir, File dataDir, String suffix) throws Exception {
        IndexWriter indexWriter = new IndexWriter(, new SimpleAnalyzer(), true,
        indexDirectory(indexWriter, dataDir, suffix);
        int numIndexed = indexWriter.maxDoc();
        return numIndexed;

    private void indexDirectory(IndexWriter indexWriter, File dataDir, String suffix) throws IOException {
        File[] files = dataDir.listFiles();
        for (int i = 0; i < files.length; i++) {
            File f = files[i];
            if (f.isDirectory()) {
                indexDirectory(indexWriter, f, suffix);
            } else {
                indexFileWithIndexWriter(indexWriter, f, suffix);


    private void indexFileWithIndexWriter(IndexWriter indexWriter, File f, String suffix) throws IOException {
        if (f.isHidden() || f.isDirectory() || !f.canRead() || !f.exists()) {

        if (suffix != null && f.getName().endsWith(suffix)) {
            System.out.println("Indexing file:... " + f.getCanonicalPath());

            Document doc = new Document();
            doc.add(new Field("contents", new FileReader(f)));
            doc.add(new Field("filename", f.getCanonicalPath(), Field.Store.YES, Field.Index.ANALYZED));



Ниже приведенКод для поиска:

public class SimpleSearcher {
    public static final String FIELD_CONTENTS = "contents";

    public static void main(String[] args) throws Exception {
        SimpleSearcher searcher = new SimpleSearcher();

    private void searchAdvancedIndex() throws IOException {
        File indexDir = new File("<path of the indexed file directory>");
        Directory directory =;
        IndexSearcher searcher = new IndexSearcher(directory);

        Query query1 = new TermQuery(new Term(FIELD_CONTENTS, "<firstName>Tom</firstName>"));
        Query query2 = new TermQuery(new Term(FIELD_CONTENTS, "<lastName>Jobs</lastName>"));

        BooleanQuery booleanQuery = new BooleanQuery();
        booleanQuery.add(query1, BooleanClause.Occur.MUST);
        booleanQuery.add(query2, BooleanClause.Occur.MUST);
        TopDocs topDocs =, 100);
        ScoreDoc[] hits = topDocs.scoreDocs;
        for (int i = 0; i < hits.length; i++) {
            int docId = hits[i].doc;
            Document d = searcher.doc(docId);

        System.out.println("Found " + hits.length);

    public static void displayQuery(Query query) {
        System.out.println("Query: " + query.toString());

Я пытаюсь выяснить, присутствуют ли в файлах тексты <firstName>Tom</firstName> и <lastName>Jobs</lastName> или нет.Когда я запустил файл, индексы были созданы успешно, но когда я запустил файл, я не получил текст.

Любая помощь будет действительно полезна и оценена.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.