Я хотел бы знать, почему для поддержки транзакций ACID необходимо объединить таблицу кустов.Это просто какая-то причуда улья?Или причина была в этом?
Вот кое-что о компакторе hive:
Компактор выполняет фоновые задания MapReduce для сжатия дельта-файлов и базовых файлов.Существует два типа уплотнения: мажорное и минорное.Незначительное сжатие объединяет много маленьких дельта-файлов в один большой дельта-файл.Основное уплотнение обходится дороже, оно берет дельта-файлы и объединяет их с базовыми файлами.Все слияние происходит путем создания нового файла и удаления старых.Для этого существует специальный процесс очистки. Уплотнение выполняется для каждого сегмента отдельно.Базовые и дельта-файлы создаются для каждого сегмента.
Подробнее здесь: https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions
Итак, чем больше сегментов, тем быстрее уплотнение.