AWS Redshift: столбцы DISTKEY / SORTKEY должны быть сжаты? - PullRequest
0 голосов
/ 03 октября 2018

Позвольте мне кое-что спросить о сжатии столбцов в AWS Redshift.Теперь мы проверяем, что можно улучшить производительность, используя соответствующий diststyle, sortkeys и сжатие столбцов.

Если я правильно понимаю, сжатие столбцов может помочь снизить стоимость ввода-вывода.Я попытался "проанализировать сжатие table_name;".И в основном Redshift предлагает использовать 'zstd' или 'lzo' в качестве метода сжатия для наших столбцов.

В общем, могу ли я попросить, чтобы столбцы, установленные как DISTKEY / SORTKEY, также были сжаты, как и другие столбцы?

Я совершенно новичок в Redshift, и любые советы будут оценены.

С уважением.

1 Ответ

0 голосов
/ 03 октября 2018

DISTKEY может быть сжат, но столбец first SORTKEY должен быть несжатым (ENCODE raw).Если у вас есть несколько ключей сортировки (составные), остальные столбцы ключей сортировки могут быть сжаты.

Кроме того, обычно рекомендуется использовать обычно фильтруемый столбец даты / времени (если он существует) в качестве первого столбца ключа сортировки в соединении.ключ сортировки.

Наконец, если вы объединяете очень большие таблицы, попробуйте использовать одинаковые ключи dist и sort для обеих таблиц, чтобы Redshift мог использовать более быстрое объединение слиянием.

...