Я использую Nutch 1.2.Когда я запускаю команду сканирования следующим образом: bin/nutch crawl urls...
Будет использоваться Apache Nutch v1.3 для извлечения только некоторого определенного контента с...
В моей системе поиска я установил интервал выборки как 30 дней. Сначала я настроил свой...
Exception in thread "main" java.lang.IllegalArgumentException: Fetcher: No agents listed...
У меня есть несколько настольных компьютеров в разных географических точках. Мне нужно создать...
Я хотел бы знать свойство, которое обозначает, сколько URL будет выбираться в секунду.Я видел из...
Я ищу сканер, который способен обрабатывать страницы с помощью Ajax и иметь возможность выполнять...
Я не могу найти подсказки о том, как настроить NUTCH, чтобы НЕ фильтровать / удалять мои параметры...
У меня есть индекс Nutch, отсканированный из определенного домена, и я использую команду solrindex,...
Я использую Nutch / Solr / SolrNet для своих поисковых решений, я должен сказать, что это работает...
Система: Mac OSX Я настроил Nutch, чтобы он сканировал и индексировал мой сайт.Он также возвращает...
Кому-нибудь посчастливилось написать пользовательские индексаторы для Nutch, чтобы индексировать...
Без фона для зависимостей плюща Я пытаюсь построить Nutch с Solr 4.0 , но я не уверен, как изменить...
У меня вопрос по Nutch v1.2. Может кто-нибудь объяснить мне, как я могу сканировать / анализировать...
Я пытаюсь повысить новые документы в запросах Solr. Функция ms Solr FAQ , кажется, правильный путь,...
$hdfs dfs -rmr crawl 11/04/16 08:49:33 INFO security.Groups: Group mapping impl=org.apache.hadoop
Я сканирую наш большой веб-сайт (ы) с помощью Nutch, а затем индексирую с помощью Solr, и...
привет: я пишу код на языке Java для Nutch (поисковая система с открытым исходным кодом), чтобы...
Я новичок в этом, пытаюсь использовать Nutch 1.2 для получения сайта. Я использую только консоль...
Неужели я хладнокровный или нет никакого способа вызвать Apache Nutch с помощью программного кода...
Если я нахожусь в середине сеанса паука и закрываю паука, все данные не будут отображаться в...
Есть ли индексные страницы Nutch снова, если они уже есть в индексе?Если так, как я могу изменить...
Хорошо, я возился с Nutch и мне нужно знать, какой параметр в файле crawl-urlfilter.txt я...
У нас есть кластер Hadoop (Hadoop 0.20), и я хочу использовать Nutch 1.2 для импорта некоторых...