Я бы хотел обработать protobufs с помощью hadoop .... но не уверен, с чего начать. Меня не волнует расщепление больших файлов. Протобуфы хранятся в виде двоичных данных ... какой класс я должен расширить, чтобы было легче
Слон-птица может обрабатывать протобуфы с помощью hadoop. Эта структура генерирует классы ввода-вывода hadoop вместе с обычными классами protobuf. Использует сжатие lzo.