Контроль количества фрагментов с помощью Apache сверла CREATE TABLE AS (CTAS) и паркета - PullRequest
0 голосов
/ 25 марта 2020

Я запускаю Drill во встроенном режиме и читаю / записываю файлы на S3.
Когда я создаю новые таблицы CTAS, он создает 6 паркетных файлов небольших фрагментов (по 1,5 МБ каждый).
Есть ли способ управления количество фрагментов?
Чтобы ограничить его одним фрагментом?
Уже пробовал следующее, но это не помогло:

ALTER SYSTEM SET store.parquet.block-size = 1073741824;
ALTER SYSTEM SET store.parquet.writer.use_single_fs_block = true;
...