Я пытаюсь написать свою собственную версию Crawl.java из Nutch, где я бы делал немного разные вещи....
Я наткнулся на сканер с открытым исходным кодом Bixo.Кто-нибудь пробовал это?Не могли бы вы...
Я хочу выбрать один из вышеперечисленных для создания структуры сканирования для определенных...
Я видел, как Натч и Херитрикс ползают.Они оба имеют концепцию циклов генерации / выборки /...
Я хочу, чтобы Nutch сканировал abc.com, но я хочу индексировать только car.abc.com.Ссылки на car
Я недавно скачал последнюю версию NUTCH.(nutch-1.1) Проходя через его код, я заметил, что есть файл...
Как сканировать изображения в Nutch?Или есть какой-нибудь другой открытый поисковик, который выдает...
Когда Nutch заканчивает свой цикл (то есть сканирование, выборка, индекс) во время фазы индекса, я...
Есть ли способ заставить Натча увеличить сканирование страниц, которое часто обновляется? Например,...
Может кто-нибудь сказать мне, как реализовать проверку орфографии в Nutch 1.0?
Некоторые сайты имеют шаблон URL от www.___.com/id=1 до www.___.com/id=1000. Как я могу сканировать...
мы пытаемся выяснить, какой дистрибутив Linux лучше всего подходит для интеграции Nutch-Hadoop? мы...
Я пытаюсь использовать Nutch (1.1) без bin / nutch из моего (java) mojarra 2.0.2 веб-приложения ......
В настоящее время собираю информацию, где я должен использовать Nutch с Solr (домен - вертикальный...
Я студент информатики и работаю над проектом, основанным на поисковой системе Nutch. Я хочу...
Я могу успешно запустить команду сканирования через Cygwin на Windows XP. и я также могу сделать...
Я не могу заставить Натча ползти для меня маленькими пятнами. Я запускаю его командой bin / nutch...
Как я могу обработать несколько соединений с хостом одновременно?
Я следовал инструкциям http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/ До этого работал...
Я ищу решение для веб-сканера, которое может быть достаточно зрелым и может быть просто расширено....
Я хочу разработать решение для управления и администрирования на основе наших perl-скриптов для...
Какую наилучшую практику и библиотеку я могу использовать для ввода текстового поля поиска на...
Мой каталог Nutch находится в /home/myserv/nutch/nutch-1.0/ Мой php-запрос находится в директории /...
Я использую программное обеспечение для веб-поиска Nutch на основе Java. Чтобы предотвратить...
Я использую Nutch-1.0, и я получаю эту запись в журнале 2009-11-12 22: 13: 11,093 INFO httpclient