Почему для поддержки транзакций ACID необходимо объединить таблицу кустов? - PullRequest
0 голосов
/ 20 февраля 2019

Я хотел бы знать, почему для поддержки транзакций ACID необходимо объединить таблицу кустов.Это просто какая-то причуда улья?Или причина была в этом?

1 Ответ

0 голосов
/ 20 февраля 2019

Вот кое-что о компакторе hive:

Компактор выполняет фоновые задания MapReduce для сжатия дельта-файлов и базовых файлов.Существует два типа уплотнения: мажорное и минорное.Незначительное сжатие объединяет много маленьких дельта-файлов в один большой дельта-файл.Основное уплотнение обходится дороже, оно берет дельта-файлы и объединяет их с базовыми файлами.Все слияние происходит путем создания нового файла и удаления старых.Для этого существует специальный процесс очистки. Уплотнение выполняется для каждого сегмента отдельно.Базовые и дельта-файлы создаются для каждого сегмента.

Подробнее здесь: https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions

Итак, чем больше сегментов, тем быстрее уплотнение.

...