Вопросы с тегом Nutch - PullRequest

Вопросы с тегом Nutch

0 голосов
0 ответов

У меня кластер небольшого размера (10 машин).Каждый из них имеет 16 ГБ оперативной памяти (которую...

Shafiq / 02 октября 2018
0 голосов
0 ответов

JVM происходит сбой каждый раз при сканировании веб-страниц с использованием Apache Nutch 1.15 на...

Gilden Antony / 28 сентября 2018
0 голосов
0 ответов

Я использую nutch1.x для просмотра и индексации сайта в solr (5.5.0).Я пытаюсь включить...

UMA MAHESWAR / 27 сентября 2018
0 голосов
0 ответов

В настоящее время я пытаюсь запустить задание Nutch под Hadoop на кластере с одним узлом (только...

Anthony Frizalone / 18 сентября 2018
0 голосов
0 ответов

У меня есть вопрос о повторном сканировании с Nutch 1.15 (или 1.14 тоже) Я прочитал статью Паскаля...

Quent / 14 сентября 2018
0 голосов
1 ответ

Я работаю над проектом с Apache Nutch 2.3.1, и мне нужно иметь возможность извлекать конкретные...

Firefly / 13 сентября 2018
0 голосов
0 ответов

Я разрабатывал пользовательский интерфейс поиска для моего приложения с использованием компонентов...

user3125823 / 05 сентября 2018
0 голосов
0 ответов

~/apache-nutch-2.3.1$ runtime/local/bin/nutch inject urls/ InjectorJob: starting at 2018-08-30...

LSA / 30 августа 2018
0 голосов
1 ответ

Nutch Crawler успешно проиндексировал документы до определенного времени. В какой-то момент его...

an__snatcher / 30 августа 2018
0 голосов
4 ответов

Я сканирую веб-сайт, на котором есть много поддоменов. Я хочу ограничить просмотр нескольких...

an__snatcher / 29 августа 2018
0 голосов
0 ответов

Скачанный Nutch 1.14 src, разархивированный во время выполнения, открыл файл nutch-site.xml и...

user3125823 / 29 августа 2018
0 голосов
0 ответов

Попытка настроить Nutch 1.14 для использования плагина indexer -astic-rest-rest для использования с...

user3125823 / 27 августа 2018
0 голосов
1 ответ

Я настроил Nutch 2.3.1 с экосистемой Hadoop / Hbase для сканирования контента на языке урду. Для...

Shafiq / 27 августа 2018
0 голосов
0 ответов

Я ползаю, используя Apache Nutch 1.13.На этапе разбора я получаю эту ошибку.Я не могу получить URL,...

Vibhor Verma / 25 августа 2018
0 голосов
1 ответ

Я использую Nutch 1.14 и пытаюсь проиндексировать небольшой веб-обход в ES v5.3.0, и я получаю эту...

user3125823 / 25 августа 2018
0 голосов
0 ответов

Я пытался добавить pdf, используя nutch mysql solrindex, но был добавлен только один документ....

최종윤 / 06 июля 2018
0 голосов
1 ответ

Как я могу сканировать страницы, основанные на аутентификации, используя Nutch?Я выполнил все...

SRISTIRUPA TRIPATHY / 26 июня 2018
0 голосов
0 ответов

Я работал с Solr и Nutch, чтобы сканировать и индексировать весь контент с моего сайта в интрасети...

EliudM / 09 июня 2018
0 голосов
1 ответ

Я хочу просканировать этот сайт: https://511.org/alerts/traffic/incidents, используя Apache Nutch

user87407 / 08 июня 2018
0 голосов
1 ответ

Я использую Nutch 2.x для сканирования домена, где каждая html-страница имеет ссылку на...

AL7 / 07 июня 2018
0 голосов
1 ответ

Попробовал поискать проблему, но не смог найти ничего полезного. После учебника в https://wiki

Rachel Tanner / 04 июня 2018
0 голосов
1 ответ

Я хочу отфильтровать URL-адрес в следующем формате: https://www.abcd.com/def/*, что означает, что...

ahcha.Z / 02 июня 2018
0 голосов
1 ответ

Я использую Apache Nutch для сканирования сайтов.Когда я использую команду readseg для чтения...

Murthy Routhula / 10 мая 2018
0 голосов
1 ответ

Я настроил Nutch 2.3.1 с полной экосистемой Hadoop / Hbase на небольшом кластере. Мне любопытно по...

Shafiq / 09 мая 2018
0 голосов
1 ответ

Я настроил Apache Nutch 2.3.1 с экосистемой Hadoop / Hbase. Ниже приведены сведения о конфигурации....

Shafiq / 08 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...