Кому-нибудь посчастливилось написать пользовательские индексаторы для Nutch, чтобы индексировать результаты сканирования с помощьюasticsearch?Или вы знаете что-нибудь, что уже существует?
Я написал плагин ElasticSearch, который высмеивает API Solr. Используя этот плагин и стандартный индексатор Nutch Solr, вы можете легко отправлять просканированные данные в ElasticSearch. Плагин и пример его использования с Nutch можно найти на GitHub:
https://github.com/mattweber/elasticsearch-mocksolrplugin
Я знаю, что Nutch будет добавлять сменные бэкэнды и рад это видеть. У меня была необходимость интегрировать эластичный поиск с Nutch 1.3. Код размещен здесь. Совместно с кодом (src / java / org / apache / nutch / indexer / solr).
https://github.com/ctjmorgan/nutch-elasticsearch-indexer
Не сделал этого, но это определенно выполнимо, но для этого потребуется вставить код SOLR (src / java / org / apache / nutch / indexer / solr) и адаптировать его к ElasticSearch. Был бы хороший вклад в Nutch BTW
Время идет, и теперь Nucth уже хорошо интегрирован с ElasticSearch. Здесь - хороший учебник.