Вам просто нужно SequenceFile.Writer
, что объясняется в вашей ссылке # 4.Это позволяет записывать пары ключ-значение в файл.Что ключ и значение, конечно, зависит от вашего варианта использования.Это совсем не то же самое для кластеризации, матричной декомпозиции и коллективной фильтрации.Не существует один SequenceFile
формат.
Скорее всего, ключ или значение будет Mahout Vector
.То, что умеет писать Vector
, это VectorWritable
.Это класс, который вы бы использовали, чтобы обернуть Vector
и написать его с SequenceFile.Writer
.
. Вам нужно будет посмотреть на задание, которое будет его использовать, чтобы убедиться, что вы проходите то, что ожидаете.Например, для кластеризации я думаю ключ игнорируется, а значение равно Vector
.