Я пытаюсь выяснить, как запустить примеры банок mahout с hadoop. Я настроил mahout и hadoop, теперь я вхожу в каталог hadoop и набираю что-то вроде этого:
/Users/hadoop/hadoop-0.20.2/bin/hadoop jar /Users/hadoop/trunk/examples/mahout-examples-0.5-SNAPSHOT-job.jar org.apache.mahout.SpareVectorsFromSequenceFile -w -i ratings -o ratings_vectors
но я пытаюсь, и моя цель - запустить задание hadoop для набора данных Grouplens. Я выполнил команду put, чтобы загрузить свой ratings.dat в Hadoop, а затем? Команда дает мне всегда что-то вроде этого:
Exception in thread "main" java.lang.ClassNotFoundException: org.apache.mahout.SpareVectorsFromSequenceFile
at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
at java.lang.ClassLoader.loadClass(ClassLoader.java:307)
at java.lang.ClassLoader.loadClass(ClassLoader.java:248)
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:247)
at org.apache.hadoop.util.RunJar.main(RunJar.java:149)
Мои вопросы:
- как я могу установить правильный путь в hadoop dir для вызова mahout?
- как я могу использовать
org.apache.mahout.cf.taste.example.grouplens.GroupLensRecommenderEvaluatorRunner
для вычисления моих данных ratings.dat с помощью hadoop?
Большое спасибо, я начинаю с hadoop и mahout;)