Ключ сортировки Redshift
Ключи сортировки предназначены только для сортировки, а не для объединения. Может быть несколько столбцов, определенных как ключи сортировки. Данные, хранящиеся в таблице, можно отсортировать по этим столбцам. Оптимизатор запросов использует эту упорядоченную таблицу сортировки при определении оптимальных планов запросов.
Также, как прокомментировал Тони,
Ключи сортировки в первую очередь предназначены для оптимизации эффективности карт зон (что-то вроде индекса BRIN) и обеспечения сканирования с ограниченным диапазоном. Они не так уж полезны в большинстве таблиц измерений, потому что таблицы размеров обычно маленькие. Единственный раз, когда ключ сортировки может помочь с производительностью объединения, - это если вы все настроите для объединения слиянием - это обычно имеет смысл только для больших объединений таблиц фактов. Чередующиеся ключи - это особые ключи сортировки и не помогают при любых объединениях.
Каждый тип этих ключей имеет определенное назначение. Это может быть хорошим прочитанным для вас.
Для объединения таблиц фактов и измерений следует использовать ключ распределения.
Ключи распределения Redshift (DIST Keys)
Определяет, где данные хранятся в Redshift. Кластеры хранят данные в основном по вычислительным узлам. Производительность запросов снижается, когда на одном узле хранится большой объем данных. Здесь хорошо для вас.
Надеюсь, это ответит на ваш вопрос.
Я хорошо видео сеанс здесь, который может быть очень полезным для понимания SORT VS DIST Key.