Рейтинг Lucene - как использовать новые модели скоринга 4.0 - PullRequest
2 голосов
/ 06 марта 2012

отчаянно пытаясь реализовать новую функцию в Lucene, я обращаюсь к вам.По существу, некоторые дополнительные скоринговые модели были добавлены в Lucene в этой JIRA-версии: https://issues.apache.org/jira/browse/LUCENE-2959

Прошу прощения за мое невежество, но я действительно не понимаю, как получить эту "версию" люцена, как описано вссылку, чтобы я мог использовать ее для своих нужд.Авторы в этой ссылке упоминают, что они внедрили новые модели ранжирования, такие как BM25, но я не знаю, где взять исходный код, а также как реализовать или запустить Lucene с этими новыми функциями.Если вы знаете, как это сделать, ваша помощь будет высоко оценена.

заранее спасибо,

Ник

Ответы [ 3 ]

5 голосов
/ 07 марта 2012

Как уже упоминалось в sdolgy, вы должны вытащить ночную сборку:

Lucene: http://lucene.apache.org/core/developer.html Solr: http://wiki.apache.org/solr/NightlyBuilds

, чтобы понять, как использовать эти модели, егодовольно просто.

Из Lucene установите сходство на свой IndexSearcher:

indexSearcher.setSimilarity(new BM25Similarity());

Из Solr установите сходство в schema.xml:

<similarity class="solr.BM25SimilarityFactory"/>

Дополнительновозможны конфигурации (например, настройка параметров, конфигурация для каждого поля и т. д.).

Для Lucene начните с обзора документации по пакету: https://builds.apache.org/view/G-L/view/Lucene/job/Lucene-trunk/javadoc/core/org/apache/lucene/search/similarities/package-summary.html

Для Solr взгляните на javadocs различных фабрик: https://builds.apache.org/view/G-L/view/Lucene/job/Solr-trunk/javadoc/org/apache/solr/search/similarities/package-summary.html

Если вам нужны более сложные примеры конфигурации Solr, взгляните на тесты в http://svn.apache.org/repos/asf/lucene/dev/trunk/solr/core/src/test-files/solr/conf/

Например, этот тестовый файл использует SchemaShoityityFactory для настройки различных моделей DFR в разных полях, чтобы можно было легко тестировать различные комбинации.работают (я не рекомендую вам пойти и настроить совершенно разные системы оценки для каждого поля, если вы не знаете, что делаете, это просто возможно, и есть несколько примеров того, как настроить фабрику): http://svn.apache.org/repos/asf/lucene/dev/trunk/solr/core/src/test-files/solr/conf/schema-dfr.xml

Аналогичные тесты для заводов других моделей существуют и в этом каталоге: http://svn.apache.org/repos/asf/lucene/dev/trunk/solr/core/src/test-files/solr/conf/schema-bm25.xml, http://svn.apache.org/repos/asf/lucene/dev/trunk/solr/core/src/test-files/solr/conf/schema-ib.xml, http://svn.apache.org/repos/asf/lucene/dev/trunk/solr/core/src/test-files/solr/conf/schema-lmdirichlet.xml, http://svn.apache.org/repos/asf/lucene/dev/trunk/solr/core/src/test-files/solr/conf/schema-lmjelinekmercer.xml, http://svn.apache.org/repos/asf/lucene/dev/trunk/solr/core/src/test-files/solr/conf/schema-tfidf.xml

2 голосов
/ 06 марта 2012

Официальной / неофициальной даты выпуска lucene 4.0 не существует, если вы хотите использовать самые последние и самые лучшие функции, которые вам нужны, чтобы оформить ствол использования ночной сборки.

http://lucene.apache.org/core/developer.html

svn checkout http://svn.apache.org/repos/asf/lucene/dev/trunk lucene_trunk

Это даст вам 4.0 и, конечно, нужные вам функции:

1 голос
/ 06 марта 2012

Оформление заказа из багажника.Если нужной вам функции нет, вам нужен патч Lucene или ночная сборка.Поскольку патч для вашей функции уже существует, вы можете проверить его и следовать инструкциям, чтобы применить ваш патч к сборке lucene, которую вы используете: http://wiki.apache.org/solr/HowToContribute#Review.2BAC8-Improve_Existing_Patches

cd {your.checkout.of.lucene.dir}
svn up
wget "https://issues.apache.org/jira/secure/attachment/12493806/LUCENE-2959.patch" -O - | patch -p0 

, которая будет применять патч к вашемусборка Lucene.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...