Я должен запустить команды сканирования Nutch с помощью php exec, но он показывает "0 Ошибка:...
Я хочу создать мини-поисковую систему на основе изображений, для которой я могу предоставить файл...
Используя Nutch для сбора URL-адресов с веб-сайтов, он заметил, что после запуска в течение...
Я пытаюсь использовать Nutch Fetcher для загрузки всего сайта, но он загружает только первый URL:...
Я пытаюсь использовать Nutch изнутри Java (не как инструмент командной строки).Вот что я делаю:...
Попытка интегрировать Apache Nutch с Hadoop.После сборки файла apache-nutch-1.15.job, который...
Я использую Nutch 1.15 с кластером hadoop 2.7.2 (Стандартный A4m v2 (4 vcpus, 32 ГБ памяти),...
интегрировать Nutch 1.15 с solr8.0, но когда я использую следующую команду nutch/bin/crawl -i -D...
Я хотел бы использовать Apache Nutch в качестве паука, который выбирает только указанный список URL...
Ссылка на эту тему нить Я также пытаюсь использовать Google Cloud Search, но другая проблема. Я...
Мне нужно использовать авторизацию NUTCH v1.14 и NTLM v2 при сканировании веб-сайтов интрасети. Я...
Я настроил apache-nutch-1.15 и hadoop для запуска в режиме развертывания по предоставленной ссылке...
Я использую Nutch 1.13 hadoop 2.7.2 и solr 5.5.0 мое приложение пытается ползти на глубину 4...
У меня настроены Apache Hbase, Nutch и кластер Hadoop.Я просканировал несколько документов, т.е....
Веб-страница, которую я использую в seed.text, содержит несколько ссылок, почти 500. Но, сохраняя...
Я использую Apache Nutch 1.12 для сканирования сайта, и теперь мне нужно сканировать некоторые...
Я установил небольшой кластер Hadoop 2.7, Hbase 0.98 и Nutch 2.3.1.Я написал специальное задание,...
Я пытаюсь сканировать некоторые сайты с помощью Apache Nutch 1.15 и индексирую их для поиска с...
У меня есть 4 системных кластера, и Apache Nutch 2.3.1 настроен для сканирования нескольких...
У меня есть гайка 1.14, работающая с Solr 6.4.2 Гайка не сканирует (прослеживает) все ссылки на...
Я использую Nutch 1.13 и Solr 5.5 seedurl: https://www.roche.com/investors.htm/ Nutch не может...
Я пытаюсь запустить Apache Nutch через Java, и я включил все JAR-файлы, необходимые для запуска...
Я пытаюсь сканировать начальные URL-адреса, которые являются http / https, но для нескольких...
Я пытаюсь настроить Apache Nutch для записи в Apache Kudu, но нигде не могу найти информацию о том,...
Я установил кластер небольшого размера, если Hadoop с Hbase для Nutch 2.3.1.Версия hadoop - 2.7.7,...