2 таблицы снежинок, одинаковые данные, разные размеры - PullRequest
0 голосов
/ 03 августа 2020

У меня есть 2 таблицы снежинок, 1 таблица этапов (ABC_Stg) и 1 обычная таблица (AB C) с дополнительными 2 столбцами, src_updt_time и расчетные значения md5 оставшихся столбцов, MD5_Cal, поэтому только данные 2 столбца дополнительных сравниваются с этапом таблицы. Однако я вижу очень большую разницу в размерах между этими двумя таблицами для одинаковых строк. Я вставляю из этапа в обычную таблицу и добавляю расчетное значение systimestamp и md5 в свой статус вставки.

, если размер таблицы этапа составляет 300 КБ для 2500 rows, Обычная таблица имеет размер 1,5 МБ

Я делаю здесь что-то не так, что приводит к огромному увеличению размера обычной таблицы?

Спасибо

1 Ответ

0 голосов
/ 03 августа 2020

Не могу ответить, не видя таблиц. Я бы проверил следующее:

  • тип данных (и размер) столбцов. Поскольку "одинаковые данные" не означают, что вы не храните числа с более высокой точностью, например, и для этого требуется больше места.
  • там, где это место, потому что обычная таблица также имеет путешествие во времени и отказоустойчив, поэтому, если любые обновления были сделаны, разница может составлять до нескольких ТБ в хранилище (ie если у вас есть таблица с 10 ТБ данных, а затем усекайте ее до 5 строк, пространство, необходимое для путешествий во времени и отказоустойчивости, все равно будет 10 ТБ до истечения срока его действия )
...