Вопросы с тегом nutch - PullRequest

Вопросы с тегом nutch

0 голосов
1 ответ

Когда я запускаю сканирование с использованием Nutch 1.15 с этим: /usr/local/nutch/bin/crawl --i -s...

user2329168 / 10 февраля 2019
0 голосов
1 ответ

Я использую Nutch 1.13 и SOLR 5.5 большую часть времени, когда поле URL = поле ID, когда документы...

sushmita / 05 февраля 2019
0 голосов
2 ответов

Я новичок в Apache Nutch.Я просканировал два данных веб-сайта с помощью Apache Nutch, чтобы...

Pratish Jha / 01 февраля 2019
0 голосов
0 ответов

Когда я запускаю сканирование из Ubuntu Nutch 1.15 с этим: /usr/local/nutch/bin/crawl --i -s...

user2329168 / 31 января 2019
0 голосов
1 ответ

Я использую Nutch 1.4 local на iOS, чтобы сканировать веб-сайт, и дэш readseg dump не возвращает...

shradha / 30 января 2019
0 голосов
1 ответ

Мы используем версию Nutch2.3, и для некоторых URL-адресов мы получаем нижеприведенное исключение...

Pavithra / 25 января 2019
0 голосов
1 ответ

Я использую Nutch 1.14, так как я использую индексатор GCS.Вот что у меня в nutch-site.xml...

shradha / 24 января 2019
0 голосов
1 ответ

Я использую Nutch версии 1.12 для сканирования URL.Мне нужно сканировать только некоторые...

Abhishek / 24 января 2019
0 голосов
1 ответ

Единственная информация, которую я могу найти в поиске Google, - это как запустить Nutch 1.3 в...

Tony Friz / 23 января 2019
0 голосов
1 ответ

Мы используем версию Nutch 2.3.1-src.Выполнение команды сканирования с глубиной 200.Но после...

Pavithra / 22 января 2019
0 голосов
1 ответ

Я использую Nutch 1.10 для сканирования веб-сайтов своей организации.Я использую систему с 16 ГБ...

UMA MAHESWAR / 22 января 2019
0 голосов
1 ответ

Я запускаю NUTCH в локальном режиме с конфигурацией сервера 64 ГБ ОЗУ и 32 процессора. Если у меня...

sushmita / 16 января 2019
0 голосов
1 ответ

Я использую версию Nutch2.3-src. Я могу сканировать веб-страницы, но это только описание, а не...

Pavithra / 14 января 2019
0 голосов
0 ответов

Я настроил Nutch и Solr, и они работают. Я использую Solr для индексации сканированных документов...

sak / 13 января 2019
0 голосов
0 ответов

Итак, у меня был сборщик Nutch 1.15, работающий неделями. В конце я убиваю работу вручную, потому...

Tony Friz / 11 января 2019
0 голосов
0 ответов

Я пытаюсь настроить Apache Nutch 1.15 с Apache Solr 7.6.0 в облачном режиме. Скрипт сканирования...

Aleksandr Sosenko / 11 января 2019
0 голосов
0 ответов

Мы настроили Nutch 2.3.1 с Hadoop 2.x и HBase 0.98. Это кластер небольшого размера. В начальном...

Shafiq / 10 января 2019
0 голосов
1 ответ

Я планирую создать веб-сканер, используя nutch и solr. Я хочу знать, какую версию hadoop я должен...

angz / 09 января 2019
0 голосов
0 ответов

Я пытаюсь настроить Nutch 1.13 для работы с Solr. Я следую этому учебнику. Но когда я использую...

angz / 08 января 2019
0 голосов
1 ответ

У меня есть Java-приложение, которое создает 4 Java-экземпляра Nutch (каждый экземпляр работает на...

sushmita / 04 января 2019
0 голосов
1 ответ

У меня есть простой Hadoop, Nutch 2.x, кластер Hbase.Я должен написать работу MR, которая найдет...

Shafiq / 02 января 2019
0 голосов
0 ответов

Редактировать: Решено переключением на Elasticsearch версии 5.3.3. Я перепробовал все.Я изменил...

Tony Friz / 24 декабря 2018
0 голосов
1 ответ

Я использую Nutch 1.15.Я хочу заменить некоторую строку проанализированного содержимого перед...

Saran / 24 декабря 2018
0 голосов
1 ответ

Я использую Nutch 1.15 и Solr 7.5 с необходимость индексировать несколько ядер .Я создал отдельные...

Lucas / 20 декабря 2018
0 голосов
0 ответов

У меня есть URL-адрес (http://someurl/test.zip). Размер zip-файла ~ 56M. Прежде всего я не хочу...

Saran / 18 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...