Хорошее эмпирическое правило для Amazon Redshift:
- Установите
DISTKEY
для наиболее часто используемого столбца в JOIN
- Установите
SORTKEY
для столбцов, наиболее часто используемых в WHERE
Поскольку ваши данные распределяются по segment
, и вы запрашиваете один segment
, все действия выполняются в одном срезе. Поэтому это не очень эффективная операция.
Если эти данные часто используют segment
в предложении WHERE
, тогда SORTKEY
должно быть segment
, а что-то еще должно быть DISTKEY
(предпочтительно что-то используемое в JOINs
или, если JOINs
не используются, затем используйте DISTKEY EVEN
).