Solr и пользовательский обработчик обновлений - PullRequest
2 голосов
/ 06 июля 2011

У меня есть вопрос о Solr и возможности реализовать настраиваемый обработчик обновлений

По сути, сценарий таков:

  • ПОЛЕ-A: мое основное поле
  • FIELD-B и FIELD-C: 2 поле копирования с источником в A

После того, как FIELD-A сохранит свое значение, мне нужно, чтобы это значение было скопировано в FIELD-B и C, затемобрабатываются (скажем, извлекают подстроку) и сохраняются в FIELD-B и C до индексации времени.Я не использую DIH.

edit: я отправляю свои данные через Nutch (забыл упомянуть, что)

Насколько я понял, copyfields срабатывает после индексации (но яя не уверен в этом).

Я уже прочитал страницу вики , и все же я не понимаю многих вещей:

1)customupdateprocessor является альтернативой условному копированию поля или они должны существовать как в моем solr?

2) после создания моего файла jar conditionalcopyfield, как мне объявить его в моей схеме?

3) какДолжен ли я изменить свой solrconfig.xml для использования моего средства обновления?

4) если я выбрал неправильный путь, любые предложения приветствуются, лучше, если приведены некоторые примеры или хорошо документированные ссылки

Я много читаю (гуглил и lucene ml на nabble), но документации по этому поводу не так много.Мне просто нужно создать собственный модуль обновления для моих двух полей копирования,

Спасибо всем заранее!

Ответы [ 2 ]

3 голосов
/ 30 марта 2012

Это не очень сложно. Вот отличная ссылка, с которой я столкнулся, чтобы написать собственный обработчик обновлений solr.

  http://knackforge.com/blog/selvam/integrating-solr-and-mahout-classifier

Я проверил его в своем solr, и он просто отлично работает!

0 голосов
/ 20 сентября 2012

Если вы используете SOLR 4 или планируете его использовать, http://wiki.apache.org/solr/ScriptUpdateProcessor может быть более простым решением. Веселись!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...