Hdfs разница между одним большим файлом против нескольких маленьких файлов - PullRequest
0 голосов
/ 04 ноября 2018

Может кто-нибудь объяснить, в чем разница между хранением одного большого (скажем, 512 МБ) файла и наличием 4x 128 МБ для одной таблицы? Если бы размер блока был 128 МБ? Я знаю, что 512 МБ будет разделен на 4 блока. Но в целом, какое преимущество / недостаток было бы хранить данные в одном файле? Спасибо за объяснение.

...