Apache Nutch 1.15 Проблемы с установкой и запуском - PullRequest
0 голосов
/ 29 апреля 2019

Я пытаюсь запустить Apache Nutch 1.15 (локально) в Windows 10, я выполнил те же действия, что и в https://wiki.apache.org/nutch/NutchTutorial и https://wiki.apache.org/nutch/NutchHadoopSingleNodeTutorial. Когда я пытаюсь внедрить URL-адреса с помощью этой команды в cygwin: bin / nutch inject crawl / crawldb urls, я получаю эту ошибку:

Injector: java.io.IOException: (null) entry in command string: null chmod 
0644 C:\Users\INFO\Desktop\apache-nutch1.15\runtime\local\crawl\crawldb\.locked

при установке %HADOOP_HOME% на системный путь (решение, предложенное на Ошибка Apache Nutch: Инжектор: java.io.IOException: (ноль) запись в командной строке: null chmod 0644 )

я получаю новую ошибку:

Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

кстати, как HADOOP_HOME, я пробовал обе папки hadoop-2.8.0 и winutil, но та же проблема.

пожалуйста, помогите.

1 Ответ

0 голосов
/ 06 июля 2019

Это известная проблема в Nutch.Пожалуйста, найдите JIRA и исправление ниже.Если вы примените изменения из GIT в вашем локальном файле bin / nutch, все снова будет работать нормально.Это будет исправлено после выхода Nutch 1.16

JIRA: https://issues.apache.org/jira/browse/NUTCH-2639?page=com.atlassian.jira.plugin.system.issuetabpanels%3Aall-tabpanel

FIX: https://github.com/apache/nutch/pull/378/commits/7e4502089ecebd194c75719485b6fce1a65797e9

...