Почему автоматическая кластеризация Snowflake такая дорогая? - PullRequest
0 голосов
/ 29 октября 2019

Я хотел бы спросить, почему автоматическая кластеризация требует относительно больших затрат по сравнению с ручной кластеризацией на выделенном большом складе? В настоящее время мы платим почти 100 кредитов в месяц за автоматическую кластеризацию некоторых таблиц, но в то же время мы также поддерживаем кластеризацию отдельных таблиц вручную, и это стоит всего несколько кредитов.

Они не очень сопоставимы,потому что таблицы разные, но мы твердо верим, что автоматическая кластеризация в целом дороже. Есть ли объяснение этому явлению?

1 Ответ

2 голосов
/ 29 октября 2019

Стоимость автоматического повторного кластеризации связана с тем, сколько дополнительных операций может найти алгоритм для уменьшения глубины, тогда как ручное повторное кластеризация просто делает то, что может для выделенных ресурсов.

Таким образом, в вашем сценарии алгоритмдолжно быть установлено, что повышение производительности может быть достигнуто за счет повторного кластеризации, чтобы гарантировать стоимость работы по повторному кластеризации.

Автоматическое повторное кластеризация имеет цель «Уменьшить наихудшую глубину кластеризации ниже допустимого порога, чтобы получить предсказуемую производительность запроса», котораяотличается от ручного повторного кластеризации, который просто группирует / сортирует столько, сколько возможно на данном складе.

...