Hadoop поддерживает SequenceFiles с самых ранних дней (если не с момента создания) https://wiki.apache.org/hadoop/SequenceFile.
Они полезны только в сценариях карты / сокращения, и сегодня вы, вероятно, захотите использовать один из столбчатых форматов (паркет)или orc) для хранения ваших данных, которые вы также можете использовать для хранения только одного ключа и одного значения, а также использовать с несколькими значениями для каждого ключа (они также содержат метаданные, которые позволят вам пропускать данные во время сканирования (например, фильтр паркетного пресса pushdown )https://drill.apache.org/docs/parquet-filter-pushdown/)
Обратите внимание, что все эти форматы не предоставят вам возможности онлайн-запросов (например, базы данных No-SQL), для которых вам нужна база данных no-sql - если вы хотите базу данных, которая хранит свои данные в HDFS, есть HBase(кстати, формат HFile, который он использует, также является многозначным форматом ключа, хранящимся в HDFS)