Hadoop обычно поддерживает следующие форматы файлов: SequenceFile, TFile и Avro.
Спасибо за вашу помощь!
MapFile - это SortedSequnceFile с индексом, позволяющим осуществлять поиск по ключу. Изображения могут храниться как есть или в SequenceFile / MapFile для обработки.