Проблемы использования "SequenceFilesFromDirectory" в моем коде - PullRequest
0 голосов
/ 05 августа 2011

Я пытаюсь написать пример программы, которая может вызывать с использованием основного метода «SequenceFilesFromDirectory», который предназначен для преобразования набора файлов в формат файла последовательности.

public class TestSequenceFileConverter {
public static void main(String args[]){   
String inputDir = "inputDir";   
String outputDir = "outoutDir";
SequenceFilesFromDirectory.main(new String[] {"--input",
        inputDir.toString(), "--output", outputDir.toString(), "--chunkSize",
        "64", "--charset",Charsets.UTF_8.name()});
}
}

Но Затмение говорит мне, что я ошибся со следующим сообщением об ошибке

Несколько маркеров на этой линии - Синтаксическая ошибка на токене "main", = ожидается после этого знак - Синтаксическая ошибка на токене (ах), неуместная конструкция (ы) - SequenceFilesFromDirectory не может быть разрешен

Я думаю, что не правильно использовал этот метод, но я не знаю, как это исправить? Большое спасибо.

Ниже описано, как определяется SequenceFilesFromDirectory. Ссылка API для SequenceFilesFromDirectory: http://search -lucene.com / jd / mahout / utils / org / apache / mahout / text / SequenceFilesFromDirectory.html

Ответы [ 2 ]

0 голосов
/ 25 сентября 2014

Я думаю, что ваша цель использования SequenceFilesFromDirectory - конвертировать файлы doc в файлы последовательности.Если это так, лучше вызывать методы run () / runSequential () / runMapReduce () после создания объекта SequenceFilesFromDirectory, поскольку SequenceFilesFromDirectory.main () внутренне вызывает метод haddop ToolRunner.run () для обработки.Принимая во внимание, что методы выполнения SequenceFilesFromDirectory выполняют фактическую обработку.

0 голосов
/ 05 августа 2011

Я предполагаю, что вам не хватает строки импорта из первого раздела вашего файла:

import org.apache.mahout.text.SequenceFilesFromDirectory;
...