Возможно, это не тот вариант использования, который вам нужен, но вы можете создать сжатую версию данных в таблице, используя инструкцию EXTERNAL TABLE.Например,
CREATE EXTERNAL TABLE 'supplier.gz' USING
(CCSID 1208 s3(
's3.amazonaws.com'
, '<S3-access-key-ID>'
, '<S3-secret-access-key>'
'<my_bucket>'
)
AS SELECT * FROM supplier
добавление PARTITION ALL
в USING
даст вам один файл на срез данных, что может быть не тем, что вы хотите, но оператор будет выполняться быстрее.Вы также можете использовать COMPRESS LZ4
, и вы получите сжатый файл (или файлы) LZ4, который снова будет быстрее.