Попробовал поискать проблему, но не смог найти ничего полезного.
После учебника в https://wiki.apache.org/nutch/NutchTutorial
Проверенный орех с мусорным ведром / орехом, и все в порядке
Устанавливаем java 8
java -version returns
java version "1.8.0_05"
Java(TM) SE Runtime Environment (build 1.8.0_05-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.5-b02, mixed mode)
и включаем в экспорт пути экспорта
export JAVA_HOME="/cygdrive/c/program files/java/jre8"
export PATH="$JAVA_HOME/bin:$PATH"
Обратите внимание на использование окон, следовательно, также используйте cygwin64.
Добавлены URL-адреса каталогов и добавлены файлыseed.txt с одним URL
Ран
bin/nutch inject crawl/crawldb urls/seed.txt
и затем получает следующую ошибку:
Инжектор: crawlDb: crawl / crawldb Инжектор: urlDir:urls / seed.txt Injector: Преобразование введенных URL-адресов для сканирования записей в БД.Инжектор: java.io.IOException: файл блокировки crawl / crawldb / .locked уже существует.