Вопросы с тегом Nutch - PullRequest

Вопросы с тегом Nutch

2 голосов
1 ответ

Я использую Nutch 1.2.Когда я запускаю команду сканирования следующим образом: bin/nutch crawl urls...

Morne Zeelie / 11 июля 2011
2 голосов
3 ответов

Будет использоваться Apache Nutch v1.3 для извлечения только некоторого определенного контента с...

Archer / 09 июля 2011
1 голос
1 ответ

В моей системе поиска я установил интервал выборки как 30 дней. Сначала я настроил свой...

sriram / 08 июля 2011
11 голосов
2 ответов

Exception in thread "main" java.lang.IllegalArgumentException: Fetcher: No agents listed...

LinuxBill / 05 июля 2011
0 голосов
1 ответ

У меня есть несколько настольных компьютеров в разных географических точках. Мне нужно создать...

Sharmila / 04 июля 2011
1 голос
1 ответ

Я хотел бы знать свойство, которое обозначает, сколько URL будет выбираться в секунду.Я видел из...

sriram / 29 июня 2011
0 голосов
2 ответов

Я ищу сканер, который способен обрабатывать страницы с помощью Ajax и иметь возможность выполнять...

Ali Salehi / 28 июня 2011
3 голосов
1 ответ

Я не могу найти подсказки о том, как настроить NUTCH, чтобы НЕ фильтровать / удалять мои параметры...

mana / 27 июня 2011
3 голосов
1 ответ

У меня есть индекс Nutch, отсканированный из определенного домена, и я использую команду solrindex,...

Hugh Lashbrooke / 21 июня 2011
0 голосов
2 ответов

Я использую Nutch / Solr / SolrNet для своих поисковых решений, я должен сказать, что это работает...

robasta / 24 мая 2011
1 голос
1 ответ

Система: Mac OSX Я настроил Nutch, чтобы он сканировал и индексировал мой сайт.Он также возвращает...

Phil Hunter / 22 мая 2011
8 голосов
4 ответов

Кому-нибудь посчастливилось написать пользовательские индексаторы для Nutch, чтобы индексировать...

neildf / 16 мая 2011
1 голос
1 ответ

Без фона для зависимостей плюща Я пытаюсь построить Nutch с Solr 4.0 , но я не уверен, как изменить...

simpatico / 09 мая 2011
1 голос
1 ответ

У меня вопрос по Nutch v1.2. Может кто-нибудь объяснить мне, как я могу сканировать / анализировать...

Thelover Mody / 05 мая 2011
0 голосов
2 ответов

Я пытаюсь повысить новые документы в запросах Solr. Функция ms Solr FAQ , кажется, правильный путь,...

Dietrich / 28 апреля 2011
2 голосов
2 ответов
4 голосов
4 ответов

Я сканирую наш большой веб-сайт (ы) с помощью Nutch, а затем индексирую с помощью Solr, и...

hayres / 11 апреля 2011
0 голосов
1 ответ

привет: я пишу код на языке Java для Nutch (поисковая система с открытым исходным кодом), чтобы...

moneera / 10 апреля 2011
1 голос
1 ответ

Я сканирую наш большой веб-сайт (ы) с помощью Nutch, а затем индексирую с помощью Solr, и...

Henry / 08 апреля 2011
0 голосов
1 ответ

Я новичок в этом, пытаюсь использовать Nutch 1.2 для получения сайта. Я использую только консоль...

dirbacke / 01 апреля 2011
8 голосов
1 ответ

Неужели я хладнокровный или нет никакого способа вызвать Apache Nutch с помощью программного кода...

ChrisJF / 24 марта 2011
0 голосов
1 ответ

Если я нахожусь в середине сеанса паука и закрываю паука, все данные не будут отображаться в...

Noah R / 16 марта 2011
2 голосов
1 ответ

Есть ли индексные страницы Nutch снова, если они уже есть в индексе?Если так, как я могу изменить...

Noah R / 16 марта 2011
0 голосов
1 ответ

Хорошо, я возился с Nutch и мне нужно знать, какой параметр в файле crawl-urlfilter.txt я...

Noah R / 16 марта 2011
0 голосов
2 ответов

У нас есть кластер Hadoop (Hadoop 0.20), и я хочу использовать Nutch 1.2 для импорта некоторых...

mihaela / 14 марта 2011
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...