Я только начал использовать Nutch на windows 10 с Cygwin. Когда я запускаю эту команду из cygwin «bin / nutch inject crawl / crawldb urls», я получаю сообщение об ошибке ниже:
$ bin/nutch inject crawl/crawldb urls
Injector: starting at 2020-04-22 01:05:45
Injector: crawlDb: crawl/crawldb
Injector: urlDir: urls
Injector: Converting injected urls to crawl db entries.
Injecting seed URL file file:/F:/Academic/Spring20/IR/apache-nutch-1.16-bin/apache-nutch-1.16/urls/seed.txt
Injector job did not succeed, job status: FAILED, reason: NA
Injector: java.lang.RuntimeException: Injector job did not succeed, job status: FAILED, reason: NA
at org.apache.nutch.crawl.Injector.inject(Injector.java:443)
at org.apache.nutch.crawl.Injector.run(Injector.java:569)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:76)
at org.apache.nutch.crawl.Injector.main(Injector.java:534)
Когда я проверяю в логах / имел oop .log, я обнаружил ниже сообщения об ошибках :
2020-04-22 01:05:47,806 ERROR output.FileOutputCommitter - Mkdirs failed to create file:/F:/Academic/Spring20/IR/apache-nutch-1.16-bin/apache-nutch-1.16/crawl/crawldb/crawldb-1609992588/_temporary/0^M
2020-04-22 01:05:48,378 INFO regex.RegexURLNormalizer - can't find rules for scope 'inject', using default^M
2020-04-22 01:05:48,589 WARN mapred.LocalJobRunner - job_local456428503_0001^M
java.lang.Exception: org.apache.hadoop.mapreduce.task.reduce.Shuffle$ShuffleError: error in shuffle in localfetcher#1^M
at org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:491)^M
Может кто-нибудь помочь, пожалуйста, как решить эту проблему?