Как выполнить mahout с установкой hadoop - PullRequest
0 голосов
/ 31 октября 2010

Я пытаюсь выяснить, как запустить примеры банок mahout с hadoop. Я настроил mahout и hadoop, теперь я вхожу в каталог hadoop и набираю что-то вроде этого:

/Users/hadoop/hadoop-0.20.2/bin/hadoop jar /Users/hadoop/trunk/examples/mahout-examples-0.5-SNAPSHOT-job.jar org.apache.mahout.SpareVectorsFromSequenceFile -w -i ratings -o ratings_vectors

но я пытаюсь, и моя цель - запустить задание hadoop для набора данных Grouplens. Я выполнил команду put, чтобы загрузить свой ratings.dat в Hadoop, а затем? Команда дает мне всегда что-то вроде этого:

Exception in thread "main" java.lang.ClassNotFoundException: org.apache.mahout.SpareVectorsFromSequenceFile
 at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
 at java.security.AccessController.doPrivileged(Native Method)
 at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
 at java.lang.ClassLoader.loadClass(ClassLoader.java:307)
 at java.lang.ClassLoader.loadClass(ClassLoader.java:248)
 at java.lang.Class.forName0(Native Method)
 at java.lang.Class.forName(Class.java:247)
 at org.apache.hadoop.util.RunJar.main(RunJar.java:149)

Мои вопросы:

  • как я могу установить правильный путь в hadoop dir для вызова mahout?
  • как я могу использовать org.apache.mahout.cf.taste.example.grouplens.GroupLensRecommenderEvaluatorRunner для вычисления моих данных ratings.dat с помощью hadoop?

Большое спасибо, я начинаю с hadoop и mahout;)

1 Ответ

1 голос
/ 01 ноября 2010

У вас есть опечатка. Это «разреженные векторы», а не «запасные векторы». См. SpareVectorsFromSequenceFile, который должен быть SparseVectorsFromSequenceFile.

...