Использует ли Lucene поиск расширенной булевой модели? - PullRequest
0 голосов
/ 08 сентября 2011

Некоторое время назад я натолкнулся на расширенную логическую модель , которая сочетает логическую поисковую логику с возможностью ранжировать документы так же, как это делает Vector Space Model.

Насколько я понимаю, именно так Lucene выполняет свою работу по ранжированию документов. Я прав?

1 Ответ

1 голос
/ 09 сентября 2011

Это комбинация модели векторного пространства и булевой модели.Оформить заказ на странице документов Оценка :

Оценка Lucene использует комбинацию Векторно-пространственной модели (VSM) поиска информации и Булевой модели, чтобы определить, насколько релевантен данный Документ дляПользовательский запрос.В целом идея, лежащая в основе VSM, заключается в том, что чем больше раз термин запроса появляется в документе относительно количества раз, когда термин появляется во всех документах в коллекции, тем более релевантным является этот документ для запроса.Он использует булеву модель, чтобы сначала сузить документы, которые должны быть оценены, основываясь на использовании булевой логики в спецификации запроса.

Если вы сравните формулы в Сходство с классической формулой VSM вы заметите, что они похожи (хотя и не равны).

...