Вопросы с тегом Nutch - PullRequest

Вопросы с тегом Nutch

1 голос
1 ответ

Я пытаюсь написать свою собственную версию Crawl.java из Nutch, где я бы делал немного разные вещи....

Nayn / 22 июля 2010
3 голосов
1 ответ

Я наткнулся на сканер с открытым исходным кодом Bixo.Кто-нибудь пробовал это?Не могли бы вы...

Nayn / 18 июля 2010
2 голосов
1 ответ

Я хочу выбрать один из вышеперечисленных для создания структуры сканирования для определенных...

Nayn / 16 июля 2010
0 голосов
1 ответ

Я видел, как Натч и Херитрикс ползают.Они оба имеют концепцию циклов генерации / выборки /...

Nayn / 15 июля 2010
1 голос
1 ответ

Я хочу, чтобы Nutch сканировал abc.com, но я хочу индексировать только car.abc.com.Ссылки на car

savannah_beckett / 15 июля 2010
1 голос
1 ответ

Я недавно скачал последнюю версию NUTCH.(nutch-1.1) Проходя через его код, я заметил, что есть файл...

milan pandya / 15 июля 2010
2 голосов
1 ответ

Как сканировать изображения в Nutch?Или есть какой-нибудь другой открытый поисковик, который выдает...

murali / 14 июля 2010
1 голос
1 ответ

Когда Nutch заканчивает свой цикл (то есть сканирование, выборка, индекс) во время фазы индекса, я...

milan pandya / 12 июля 2010
1 голос
1 ответ

Есть ли способ заставить Натча увеличить сканирование страниц, которое часто обновляется? Например,...

grm / 08 июля 2010
0 голосов
1 ответ

Может кто-нибудь сказать мне, как реализовать проверку орфографии в Nutch 1.0?

devna / 25 июня 2010
0 голосов
2 ответов

Некоторые сайты имеют шаблон URL от www.___.com/id=1 до www.___.com/id=1000. Как я могу сканировать...

user365345 / 12 июня 2010
2 голосов
2 ответов

мы пытаемся выяснить, какой дистрибутив Linux лучше всего подходит для интеграции Nutch-Hadoop? мы...

vipin k. / 01 июня 2010
0 голосов
3 ответов

Я пытаюсь использовать Nutch (1.1) без bin / nutch из моего (java) mojarra 2.0.2 веб-приложения ......

Marcel / 17 мая 2010
8 голосов
1 ответ

В настоящее время собираю информацию, где я должен использовать Nutch с Solr (домен - вертикальный...

Jeriho / 12 мая 2010
0 голосов
1 ответ

Я студент информатики и работаю над проектом, основанным на поисковой системе Nutch. Я хочу...

elmouad / 02 мая 2010
0 голосов
1 ответ

Я могу успешно запустить команду сканирования через Cygwin на Windows XP. и я также могу сделать...

MonsterMMORPG / 07 апреля 2010
4 голосов
1 ответ

Я не могу заставить Натча ползти для меня маленькими пятнами. Я запускаю его командой bin / nutch...

Yurish / 29 марта 2010
1 голос
1 ответ

Как я могу обработать несколько соединений с хостом одновременно?

sev / 17 марта 2010
0 голосов
1 ответ

Я следовал инструкциям http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/ До этого работал...

Ian / 26 февраля 2010
7 голосов
4 ответов

Я ищу решение для веб-сканера, которое может быть достаточно зрелым и может быть просто расширено....

fifigyuri / 18 января 2010
2 голосов
3 ответов

Я хочу разработать решение для управления и администрирования на основе наших perl-скриптов для...

Bigtwinz / 22 декабря 2009
0 голосов
1 ответ

Какую наилучшую практику и библиотеку я могу использовать для ввода текстового поля поиска на...

cometta / 16 декабря 2009
1 голос
2 ответов

Мой каталог Nutch находится в /home/myserv/nutch/nutch-1.0/ Мой php-запрос находится в директории /...

Annibigi / 18 ноября 2009
0 голосов
1 ответ

Я использую программное обеспечение для веб-поиска Nutch на основе Java. Чтобы предотвратить...

Anand Krishnan / 17 ноября 2009
0 голосов
1 ответ

Я использую Nutch-1.0, и я получаю эту запись в журнале 2009-11-12 22: 13: 11,093 INFO httpclient

Sunil / 12 ноября 2009
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...