Как вы используете Lucene. Net phoneti c поиск - PullRequest
1 голос
/ 12 марта 2020

Документация Lucene. Net крайне отсутствует - я пытался выяснить, как использовать Lucene. Net phoneti c функция поиска .

Я в основном ссылался на тестовый проект lucene.ne git для PhoneticFilter: https://github.com/apache/lucenenet/blob/master/src/Lucene.Net.Tests.Analysis.Phonetic/TestPhoneticFilter.cs

How Я создаю свой индекс:

// add new index entry
Document doc = new Document
{
    new TextField("brand", vehicle.Brand ?? string.Empty, Field.Store.YES),
    new TextField("range", vehicle.Range ?? string.Empty, Field.Store.YES),
    new TextField("model", vehicle.Model ?? string.Empty, Field.Store.YES),
    new TextField("year", vehicle.Year ?? string.Empty, Field.Store.YES),
};

// add entry to index
writer.AddDocument(doc);

Далее из теста кажется, что вы можете добавить PhoneticFilter к Analyzer:

// set up lucene searcher
using DirectoryReader reader = DirectoryReader.Open(Directory);

Analyzer analyzer = Analyzer.NewAnonymous(createComponents: (fieldName, reader) =>
{
    Tokenizer tokenizer = new KeywordTokenizer(reader);
    return new TokenStreamComponents(tokenizer, new PhoneticFilter(tokenizer, new Soundex(), false));
});

IndexSearcher searcher = new IndexSearcher(reader);
int hits_limit = searchModel.Start + searchModel.Qty;
TopDocs topDocs;
Sort sortOrder = null;

BooleanQuery vehicleFilterQuery = new BooleanQuery();

var brandParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "brand", analyzer);
var brandQuery = ParseQuery(searchModel.SearchTerm, brandParser);
brandQuery.Boost = 4.0f;
vehicleFilterQuery.Add(brandQuery, Occur.SHOULD);

var rangeParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "range", analyzer);
var rangeQuery = ParseQuery(searchModel.SearchTerm, rangeParser);
rangeQuery.Boost = 3.0f;
vehicleFilterQuery.Add(rangeQuery, Occur.SHOULD);

var modelParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "model", analyzer);
var modelQuery = ParseQuery(searchModel.SearchTerm, modelParser);
modelQuery.Boost = 2.0f;
vehicleFilterQuery.Add(modelQuery, Occur.SHOULD);

var yearParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "year", analyzer);
var yearQuery = ParseQuery(searchModel.SearchTerm, yearParser);
yearQuery.Boost = 1.0f;
vehicleFilterQuery.Add(yearQuery, Occur.SHOULD);

topDocs = searcher.Search(vehicleFilterQuery, null, hits_limit, sortOrder ?? Sort.RELEVANCE);
ScoreDoc[] subset = topDocs.ScoreDocs.Skip(searchModel.Start).Take(searchModel.Qty).ToArray();

return MapToModelList(subset, searcher);

После реализации этого для проверки я ищу с Audee, ожидая получить кучу Audi результатов, но хотя обычный (правильно прописанный) поиск работает, поиск phoneti c, похоже, не оказывает влияния.

Я пробовал кодировщики Metaphone(), DoubleMetaphone(), Soundex(), RefinedSoundex(), Caverphone1() и Caverphone2()

Метафон https://lucenenetdocs.azurewebsites.net/api/Lucene.Net.Analysis/Lucene.Net.Analysis.Phonetic.Language.Metaphone.html

DoubleMetaphone https://lucenenetdocs.azurewebsites.net/api/Lucene.Net.Analysis/Lucene.Net.Analysis.Phonetic.Language.DoubleMetaphone.html

Soundex https://lucenenetdocs.azurewebsites.net/api/Lucene.Net.Analysis/Lucene.Net.Analysis.Phonetic.Language.Soundex.html

RefinedSoundex https://lucenenetdocs.azurewebsites.net/api/Lucene.Net.Analysis/Lucene.Net.Analysis.Phonetic.Language.RefinedSoundex.html

Caverphone1 https://lucenenetdocs.azurewebsites.net/api/Lucene.Net.Analysis/Lucene.Net.Analysis.Phonetic.Language.Caverphone1.html

Caverphone2 https://lucenenetdocs.azurewebsites.net/api/Lucene.Net.Analysis/Lucene.Net.Analysis.Phonetic.Language.Caverphone2.html

...