Как происходит компиляция Nutch в один файл Jar (и его запуск)? - PullRequest
1 голос
/ 17 февраля 2011

Я пытаюсь запустить сканер Nutch таким образом, чтобы я мог получить доступ ко всем его функциям через один файл JAR, который содержит все его зависимости.

Например,

java -jar nutch-all-1.2.jar -crawl <other params>

и на более позднем этапе, вызовите его с помощью hadoop.

В настоящее время делаем

java -jar nutch-1.2.jar 

в файле JAR, который существует в каталоге Nutch, приводит к ошибке,

Failed to load Main-Class manifest attribute from
nutch-1.2.jar

Я полагаю, что это происходит потому, что этот конкретный JAR-файл не содержит файлы манифеста XML или другие зависимые JAR-файлы. Что бы вы посоветовали в качестве наилучшего метода для создания Nutch в один JAR для этой цели?

Спасибо!

1 Ответ

1 голос
/ 03 марта 2011

После долгих осмотров я понял, что для простого запуска Nutch из командной строки можно использовать файл nutch.job. Синтаксис:

hadoop jar nutch-1.0.job org.apache.nutch.crawl.Crawl urls -dir crawl -depth 1
...