Я использую Lucene для Java, и мне нужно выяснить, что делает движок, когда я выполняю некоторые непонятные запросы. Возьмите следующий запрос:
+(foo -bar)
Если я использую QueryParser для разбора ввода, я получаю объект BooleanQuery, который выглядит следующим образом:
org.apache.lucene.search.BooleanQuery:
org.apache.lucene.search.BooleanClause(required=true, prohibited=false):
org.apache.lucene.search.BooleanQuery:
org.apache.lucene.search.BooleanClause(required=false, prohibited=false):
org.apache.lucene.search.TermQuery: foo
org.apache.lucene.search.BooleanClause(required=false, prohibited=true):
org.apache.lucene.search.TermQuery: bar
Что ищет Lucene? Это документы, которые ДОЛЖНЫ содержать «foo», но НЕ МОГУТ содержать «bar»? Что делать, если я ищу:
-(foo +bar)
Являются ли те документы, которые НЕ МОГУТ содержать 'foo' и НЕ МОГУТ содержать 'bar'? Или, возможно, те, которые НЕ МОГУТ содержать 'foo', но ДОЛЖНЫ содержать 'bar'?
Если это поможет, вот что я использовал для просмотра результатов QueryParser:
QueryParser parser = new QueryParser("contents", new StandardAnalyzer());
Query query = parser.parse(text);
debug(query, 0);
public static void debug(Object o, int depth) {
for(int i=0; i<depth; i++) System.out.print("\t");
System.out.print(o.getClass().getName());
if(o instanceof BooleanQuery) {
System.out.println(":");
for(BooleanClause clause : ((BooleanQuery)o).getClauses()) {
debug(clause, depth + 1);
}
} else if(o instanceof BooleanClause) {
BooleanClause clause = (BooleanClause)o;
System.out.println("(required=" + clause.isRequired() + ", prohibited=" + clause.isProhibited() + "):");
debug(clause.getQuery(), depth + 1);
} else if(o instanceof TermQuery) {
TermQuery term = (TermQuery)o;
System.out.println(": " + term.getTerm().text());
} else {
throw new IllegalArgumentException("Unknown object type");
}
}