Улучшение веса html заголовков страниц в Lucene. NET поиск с использованием Orchard CMS - PullRequest
0 голосов
/ 26 февраля 2020

Я использую Lucene. NET для поиска Orchard CMS. С чем я сталкиваюсь, так это с увеличением веса документов, в заголовках которых есть условия поиска, поэтому рассмотрим следующие фрагменты документа:

Документ 1:

<html>
  ....
<body>
.....
  <h1>Search Term</h1>
.....
</body>
</html>

Документ 2:

<html>
  ....
<body>
.....
  <h2>Search Term</h2>
.....
</body>
</html>

Документ 3:

<html>
  ....
<body>
.....
  <p>Search Term</p>
  .......
  <p>Search Term</p>
  .......
  <p>To search Orchard CMS you use Lucene.NET and pass the search term to Lucene.NET which then uses it's index to search the Orchard Content.</p>
</body>
</html>

Таким образом, цель состоит в том, что, если строка поиска Search Term, тогда Документ 1 имеет больший вес, чем Документ 2, а Документ 2 имеет больший вес, чем в Документе 3. Даже если Search Term встречается чаще в Документе 3 по сравнению с Документом 1

...