Я использую Nutch для сканирования веб-сайтов и, как ни странно, для одного из моих веб-сайтов...
Я настроил поисковую систему Nutch для сканирования веб-сайтов. Теперь мне нужно написать php API...
Я хочу знать, как я могу сканировать PDF-файлы, которые обслуживаются в Интернете, используя...
Я новичок в Nutch, но я знаю, что Nutch использует Lucene для индексации, которая понимает только...
Я настроил Nutch с db.fetch.interval.default 60000, чтобы я мог ползти каждый день. Если я этого не...
В натч-вики есть инструкции по , как создавать плагины орешков , но только если вы загрузите все...
Я использовал что-то вроде: Field notdirectory = new Field("notdirectory","1",...
Я пытаюсь настроить Nutch для запуска многопоточного сканирования. Однако у меня возникла проблема....
Я установил Nutch 1.0 в кластере. Он был настроен и успешно просканирован. Я скопировал каталог для...
не основано на http, как http://localhost:81 и так далее, но непосредственно сканировать...
Скажите, ищите результаты, у которых поле 'A' или 'B'? кажется, что по умолчанию используется AND.
Я сейчас пытаюсь написать собственный плагин для NUTCH 1.0. Этот плагин должен анализировать...
Я годами не смотрел на Натча, и похоже, что он сильно изменился. Документация по повторному...
Я следую учебному пособию здесь: http://nutch.sourceforge.net/docs/en/tutorial.html Сканирование...
Кто-нибудь пробовал установить Nutch на Windows? Я следую этому руководству по установке:...
Я хочу знать, существуют ли какие-либо тесты и информация о размерах для развертывания поисковой...
Наша компания имеет тысячи документов в формате PDF. Как нам создать простую поисковую систему,...
Могу ли я интегрировать сканер Apache Nutch с сервером Solr Index? Edit: Один из наших...
У меня есть настройка Nutch и Lucene для сканирования и индексации некоторых сайтов, и я хотел бы...