Hive 3.1 Дельта-файлы ACID - Незначительное автоматическое уплотнение не запущено - PullRequest
0 голосов
/ 07 ноября 2018

У меня есть таблица кустов с включенной кислотой, с разделением на сегменты, в которую я пишу с помощью потокового клиента. Я вижу, что несколько дельта-файлов создаются, когда записи записываются в разделы. Я хотел включить автоматическое уплотнение и пробовал следующие базовые и конкретные параметры:

    hive.support.concurrency=true 
    hive.enforce.bucketing=true 
    hive.exec.dynamic.partition.mode=nonstrict 
    hive.txn.manager=org.apache.hadoop.hive.ql.lockmgr.DbTxnManager 
    hive.compactor.initiator.on=true 
    hive.compactor.worker.threads=1

с

hive.compactor.initiator.on=true 
hive.compactor.cleaner.run.interval=5000ms 
hive.compactor.delta.num.threshold=10 (to enable minor for 10 deltas)
hive.compactor.delta.pct.threshold=1000 (to disable major)
hive.compactor.abortedtxn.threshold=1000 
hive.compactor.initiator.failed.compacts.threshold=2 
hive.compactor.abortedtxn.threshold=1000

Я сделал это с надеждой на отключение Major сжатие и включение автоматический незначительное сжатие (порог = 10 дельта-файлов). Однако я вижу, что сжатие не запускается автоматически. Когда я запускаю его (вспомогательный) вручную, я вижу сегменты в нескольких дельта-файлах, которые объединяются в один дельта-файл. Как включить автоматическое минорное сжатие для таблицы?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...