Это ошибка или проблема установки для использования NewsKMeasnClustering.java - PullRequest
2 голосов
/ 09 августа 2011

Это ошибка или настройка в NewsKMeansClustering.java, пример кода, приведенного в главе 9 Mahout-in-Action?Я запускал эту программу с каталогом файлов последовательности.Выходное сообщение об ошибке выглядит следующим образом:

Исключение в потоке "main" java.io.FileNotFoundException: файл newsClusters / clustersclusteredPoints / part-m-00000 не существует.в org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus (RawLocalFileSystem.java:361) в org.apache.hadoop.fs.FilterFileSystem.getFileStatus (FilterFileSystem.java:245) в org.apache.hadoop.fs.FileSystem(FileSystem.java:676) в org.apache.hadoop.io.SequenceFile $ Reader. (SequenceFile.java:1417) в org.apache.hadoop.io.SequenceFile $ Reader. (SequenceFile.java:1412) в mia.clustering.ch09.NewsKMeansClustering.main (NewsKMeansClustering.java:76)

Структура каталогов моей среды разработки также выглядит следующим образом:

~ / workspaceMahout1 /Recommender / newsClusters% ls кластеры центробежных навесов df-count dictionary.file-0quency.file-0 tfidf-векторы tf-векторы tokenized-documents wordcount ~ / workspaceMahout1 / Recommender / newsClusters / clusters / clusterteredPoints% ls part-m-00000

После этого я меняю код с исходного

new Path(clusterOutput+Cluster.CLUSTERED_POINTS_DIR +”/part-m-00000”), conf);

на

new Path(clusterOutput+”/clusteredPoints”+”/part-m-00000”), conf);

Программа может пройти без указания ошибкиили сообщения.Я хотел бы знать, это ошибка в исходном коде или есть другие скрытые проблемы?

...