Каков наилучший способ чтения / записи двоичных файлов ввода / вывода с помощью MapReduce? - PullRequest
2 голосов
/ 12 сентября 2011

Во всех примерах, которые я видел до сих пор, приложения mapreduce принимают текстовые файлы в качестве входных данных и записывают текст в качестве выходных.

Я бы хотел, чтобы мое приложение считывало объекты из двоичного файла и записывало объекты обратно в выходной файл.

Каков наилучший способ сделать это в MapReduce?

Я пишу приложение в Java

1 Ответ

1 голос
/ 13 сентября 2011

SequenceFile обеспечивает постоянную структуру данных для двоичных пар ключ-значение. Вы можете найти больше информации в следующем URL.

http://wiki.apache.org/hadoop/SequenceFile

http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/io/SequenceFile.html

...