Чем хранилище Snowflake отличается от обычной реляционной базы данных в облаке, например, SQL Сервер на Azure? - PullRequest
0 голосов
/ 07 февраля 2020

Далее, как Снежинка "колонизирует" все свои данные?

Ничто из того, что я прочитал, не объяснило это хорошо

Ответы [ 2 ]

4 голосов
/ 07 февраля 2020

Слой хранения Снежинки отделен от вычислений. Таким образом, вы можете увеличивать и уменьшать объем вычислений и хранилищ по отдельности и мгновенно (в течение нескольких секунд для больших экземпляров). В Snowflake используется собственный формат хранения, который называется микроразделы . Вы также можете узнать больше об архитектуре хранения данных Snowflake в статье SIGMOD .

Обычная реляционная база данных в облаке - если это просто виртуальная машина с установленной реляционной базой данных - это та же реляционная база данных. база данных, к которой вы привыкли размещать локально, но вместо этого она была буквально «поднята и перенесена» в облако. Таким образом, недостатком является то, что вычисления и хранилище тесно связаны. Боль в том, что вам нужно больше планировать заранее, сколько вы планируете использовать в ваши дни наибольшего использования; заряжаются, даже когда система не используется; а переход на более мощные вычисления или хранилище является более сложным, рискованным и длительным.

0 голосов
/ 10 февраля 2020

Данные в Снежинке делятся и хранятся в виде микроразделов, которые являются непрерывными единицами хранения.

Каждый микрораздел содержит несжатые данные размером от 50 МБ до 500 МБ.

Группировка строк выполняется на столе и сопоставляется с отдельными микроразделами, организованными в виде столбцов.

https://docs.snowflake.net/manuals/user-guide/tables-clustering-micropartitions.html#what -are-micro-разбиения

...