Вопросы с тегом Nutch - PullRequest

Вопросы с тегом Nutch

0 голосов
1 ответ

Я боролся с запуском Java-процесса из Perl.Корень проблемы в том, что в Java-процессе отсутствует...

user1214836 / 17 февраля 2012
0 голосов
1 ответ

После одного дня ползания с орехом (1.4) ... наконец я получил плохое плохое исключение: . . ....

hadi / 15 февраля 2012
0 голосов
1 ответ

Я использую apache-nutch-1.4 с apache-solr-3.2.0 Я успешно интегрировал ОРЕХ с SOLR когда я...

Muhammad Umair / 15 февраля 2012
0 голосов
1 ответ

Я использую apache-nutch-1.4 с apache-solr-3.2.0 Я могу установить оба иинтегрировать успешно ,...

Muhammad Umair / 14 февраля 2012
0 голосов
1 ответ

Я удаляю сегменты после того, как они проиндексированы, тогда как Nutch получит время последней...

NutchUser / 10 февраля 2012
0 голосов
1 ответ

Похоже, что только индексы NUTCH (некоторые) анализируют результаты.Он запускает фильтры индексации...

AAaa / 09 февраля 2012
0 голосов
1 ответ

Я использую Nutch и хотел бы индексировать интрасеть, но как убедиться, что все в интрасети будет...

bobosh / 07 февраля 2012
0 голосов
2 ответов

В сущности, я реализую плагин, который будет получать содержимое веб-страниц и обрабатывать их...

Haya aziz / 07 февраля 2012
1 голос
2 ответов

У меня есть миллион URL-адресов для получения. Я использую этот список как семена орехов и...

Xiao / 06 февраля 2012
0 голосов
1 ответ

У меня db.max.anchor.length установлено на 5, но Nutch по-прежнему выбирает URL с длиной привязки...

NutchUser / 03 февраля 2012
0 голосов
1 ответ

В каких случаях URL перешел на фазу db_unfetched. делает URL не удовлетворяющим crawlurlfilter.txt...

NutchUser / 03 февраля 2012
0 голосов
1 ответ

Я использую Nutch 1.4, и я хотел бы отобразить статическое поле в Solr. Я знаю, что есть плагин...

bobosh / 31 января 2012
0 голосов
1 ответ

Могу ли я получить поля заголовка ответа HTTP, проанализированные с помощью Nutch? Это встроенная...

AAaa / 31 января 2012
0 голосов
2 ответов

Я сканирую сайт с помощью Nutch 1.4, я понимаю, что Nutch не сканирует все ссылки на этом сайте. у...

helen / 31 января 2012
0 голосов
1 ответ

in nutch, я ищу способ получить содержимое страницы как есть (со строками, новыми строками и...

Haya aziz / 30 января 2012
0 голосов
1 ответ

На каком сайте Criteia Nchch выбирает TopN документы при сканировании?И как Nutch создает сегменты

search_dev / 27 января 2012
0 голосов
1 ответ

Я использую Nutch для сканирования большого сайта. Веб-страницы создаются программой CGI. URL...

Xiao / 27 января 2012
0 голосов
1 ответ

Я пытаюсь настроить Nutch в качестве сканера изображений и уже могу получить URL-адреса изображений...

juffun / 26 января 2012
1 голос
2 ответов

Я успешно запустил Nutch (v1.4) для сканирования в локальном режиме в моей системе Ubuntu 11.10....

Saif Saif / 25 января 2012
0 голосов
1 ответ

Можно ли определить определенный тип файла, который будет сканироваться? Я пытаюсь обойти файл...

AAaa / 23 января 2012
0 голосов
1 ответ

Я хочу создать набор данных, состоящий из 2000-3000 веб-страниц, начиная с нескольких начальных URL

samsamara / 22 января 2012
0 голосов
2 ответов

<configuration> <property> <name>searcher.dir</name>...

Solr Newbie / 21 января 2012
4 голосов
2 ответов

Я работаю над созданием пользовательского NUTCH плагина со специальными требованиями. Я обнаружил,...

Haya aziz / 16 января 2012
0 голосов
2 ответов

Я хочу отсканировать какой-нибудь проект на GitHub, скажем, я хочу отсканировать исходный код,...

Allahbaksh Asadullah / 11 января 2012
0 голосов
1 ответ

Я использую Nutch 1.4 для реализации сфокусированного гусеничного механизма.Может кто-нибудь...

Vijith / 09 января 2012
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...