Вопросы с тегом Nutch - PullRequest

Вопросы с тегом Nutch

0 голосов
1 ответ

Я должен запустить команды сканирования Nutch с помощью php exec, но он показывает "0 Ошибка:...

vishnu / 12 апреля 2019
0 голосов
1 ответ

Я хочу создать мини-поисковую систему на основе изображений, для которой я могу предоставить файл...

Ishan / 09 апреля 2019
0 голосов
0 ответов

Используя Nutch для сбора URL-адресов с веб-сайтов, он заметил, что после запуска в течение...

mhdwrk / 07 апреля 2019
0 голосов
1 ответ

Я пытаюсь использовать Nutch Fetcher для загрузки всего сайта, но он загружает только первый URL:...

yegor256 / 29 марта 2019
0 голосов
0 ответов

Я пытаюсь использовать Nutch изнутри Java (не как инструмент командной строки).Вот что я делаю:...

yegor256 / 28 марта 2019
2 голосов
1 ответ

Попытка интегрировать Apache Nutch с Hadoop.После сборки файла apache-nutch-1.15.job, который...

vamsi krishna / 28 марта 2019
0 голосов
0 ответов

Я использую Nutch 1.15 с кластером hadoop 2.7.2 (Стандартный A4m v2 (4 vcpus, 32 ГБ памяти),...

sushmita / 25 марта 2019
0 голосов
1 ответ

интегрировать Nutch 1.15 с solr8.0, но когда я использую следующую команду nutch/bin/crawl -i -D...

Vekaco / 23 марта 2019
0 голосов
1 ответ

Я хотел бы использовать Apache Nutch в качестве паука, который выбирает только указанный список URL...

Bociek / 22 марта 2019
0 голосов
1 ответ

Ссылка на эту тему нить Я также пытаюсь использовать Google Cloud Search, но другая проблема. Я...

Popkorn / 16 марта 2019
0 голосов
0 ответов

Мне нужно использовать авторизацию NUTCH v1.14 и NTLM v2 при сканировании веб-сайтов интрасети. Я...

shradha / 15 марта 2019
2 голосов
1 ответ

Я настроил apache-nutch-1.15 и hadoop для запуска в режиме развертывания по предоставленной ссылке...

vamsi krishna / 13 марта 2019
0 голосов
0 ответов

Я использую Nutch 1.13 hadoop 2.7.2 и solr 5.5.0 мое приложение пытается ползти на глубину 4...

sushmita / 07 марта 2019
0 голосов
0 ответов

У меня настроены Apache Hbase, Nutch и кластер Hadoop.Я просканировал несколько документов, т.е....

Shafiq / 27 февраля 2019
0 голосов
0 ответов

Веб-страница, которую я использую в seed.text, содержит несколько ссылок, почти 500. Но, сохраняя...

ABHISAR BHARTI / 23 февраля 2019
0 голосов
0 ответов

Я использую Apache Nutch 1.12 для сканирования сайта, и теперь мне нужно сканировать некоторые...

user12345 / 22 февраля 2019
0 голосов
1 ответ

Я установил небольшой кластер Hadoop 2.7, Hbase 0.98 и Nutch 2.3.1.Я написал специальное задание,...

Shafiq / 22 февраля 2019
0 голосов
1 ответ

Я пытаюсь сканировать некоторые сайты с помощью Apache Nutch 1.15 и индексирую их для поиска с...

maru1926 / 20 февраля 2019
0 голосов
0 ответов

У меня есть 4 системных кластера, и Apache Nutch 2.3.1 настроен для сканирования нескольких...

Shafiq / 20 февраля 2019
0 голосов
1 ответ

У меня есть гайка 1.14, работающая с Solr 6.4.2 Гайка не сканирует (прослеживает) все ссылки на...

Rambo / 15 февраля 2019
0 голосов
0 ответов

Я использую Nutch 1.13 и Solr 5.5 seedurl: https://www.roche.com/investors.htm/ Nutch не может...

sushmita / 14 февраля 2019
0 голосов
1 ответ

Я пытаюсь запустить Apache Nutch через Java, и я включил все JAR-файлы, необходимые для запуска...

Akhil / 14 февраля 2019
0 голосов
2 ответов

Я пытаюсь сканировать начальные URL-адреса, которые являются http / https, но для нескольких...

sushmita / 13 февраля 2019
0 голосов
1 ответ

Я пытаюсь настроить Apache Nutch для записи в Apache Kudu, но нигде не могу найти информацию о том,...

Виталий Олегович / 12 февраля 2019
0 голосов
1 ответ

Я установил кластер небольшого размера, если Hadoop с Hbase для Nutch 2.3.1.Версия hadoop - 2.7.7,...

Shafiq / 12 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...