Индексировали ли вы результаты сканирования Nutch с помощьюasticsearch раньше? - PullRequest
8 голосов
/ 16 мая 2011

Кому-нибудь посчастливилось написать пользовательские индексаторы для Nutch, чтобы индексировать результаты сканирования с помощьюasticsearch?Или вы знаете что-нибудь, что уже существует?

Ответы [ 4 ]

10 голосов
/ 10 февраля 2012

Я написал плагин ElasticSearch, который высмеивает API Solr. Используя этот плагин и стандартный индексатор Nutch Solr, вы можете легко отправлять просканированные данные в ElasticSearch. Плагин и пример его использования с Nutch можно найти на GitHub:

https://github.com/mattweber/elasticsearch-mocksolrplugin

3 голосов
/ 21 ноября 2011

Я знаю, что Nutch будет добавлять сменные бэкэнды и рад это видеть. У меня была необходимость интегрировать эластичный поиск с Nutch 1.3. Код размещен здесь. Совместно с кодом (src / java / org / apache / nutch / indexer / solr).

https://github.com/ctjmorgan/nutch-elasticsearch-indexer

2 голосов
/ 25 мая 2011

Не сделал этого, но это определенно выполнимо, но для этого потребуется вставить код SOLR (src / java / org / apache / nutch / indexer / solr) и адаптировать его к ElasticSearch. Был бы хороший вклад в Nutch BTW

0 голосов
/ 15 января 2016

Время идет, и теперь Nucth уже хорошо интегрирован с ElasticSearch. Здесь - хороший учебник.

...