В дополнение к превосходному ответу @ Oscar-Godson вы, вероятно, столкнетесь с проблемами со значениями, намного превышающими 50 МБ.Bitcask лучше всего подходит для значений до нескольких килобайт.Если вы храните большие значения, вы можете рассмотреть альтернативные бэкэнды хранилища, такие как innostore .
У меня нет опыта хранения двоичных значений, но у нас есть средаразмерный кластер в производстве (5 узлов, порядка 100M значений, 10 ТБ), и мы наблюдаем частые ошибки, связанные со вставкой и получением значений размером 100 КБ.Производительность в этом случае противоречива - иногда это работает, а другие нет - поэтому, если вы собираетесь тестировать, тестируйте в масштабе.
Мы также видим проблемы с большими значениями при запуске map-уменьшить количество запросов - они просто перестают работатьОднако это может быть менее актуально для двоичных значений ... (как упоминал @ Matt-Ranney).
Также см. Ответ @ Stephen-C здесь