Я использую Lucene. NET для поиска Orchard CMS. С чем я сталкиваюсь, так это с увеличением веса документов, в заголовках которых есть условия поиска, поэтому рассмотрим следующие фрагменты документа:
Документ 1:
<html>
....
<body>
.....
<h1>Search Term</h1>
.....
</body>
</html>
Документ 2:
<html>
....
<body>
.....
<h2>Search Term</h2>
.....
</body>
</html>
Документ 3:
<html>
....
<body>
.....
<p>Search Term</p>
.......
<p>Search Term</p>
.......
<p>To search Orchard CMS you use Lucene.NET and pass the search term to Lucene.NET which then uses it's index to search the Orchard Content.</p>
</body>
</html>
Таким образом, цель состоит в том, что, если строка поиска Search Term
, тогда Документ 1 имеет больший вес, чем Документ 2, а Документ 2 имеет больший вес, чем в Документе 3. Даже если Search Term
встречается чаще в Документе 3 по сравнению с Документом 1