Я использовал Nutch и Elasticsearch много раз прежде, однако, я считаю, что я использовал настройку по умолчанию, где Nutch использовал двоичный транспортный метод для связи с Elasticsearch.Это было просто и работало из коробки, поэтому я использовал его много раз.
Я занимался обновлением системы сканирования, и теперь, кажется, лучше использовать Jest Библиотека API REST.
Однако я немного запутался по этому поводу ...
Во-первых, как мне установить библиотеку Jest для использования с Nutch и Elasticsearch.Я знаю, что могу скачать или клонировать через Github, но .. как это связано?
Я буквально просто обновляю зависимости в файлах / indexer -astic-rest * .xml для Nutch, а затем просто собираю заново сant?
В моей первой установке Nutch использовался двоичный zip.Я только недавно начал использовать пакет src, поэтому ant / maven является для меня чем-то новым - вот почему все это немного сбивает с толку.Во всех блогах и статьях говорится «и затем перестроить с помощью ant» ...
Второе - библиотека Jest заботится обо всем Java REST API-коде или мне нужно писать код Java сейчас?