Hibari - не рекомендуется упаковывать 720 ГБ данных в кластер Redshift с максимальным объемом хранения 800 ГБ. Это происходит по нескольким причинам:
- Требуется место на диске в качестве пустого места для выполнения запросов и других операций с данными (вакуум)
- Скретч-данные не сжимаются при хранении на диске
- Операциям загрузки данных, таким как COPY, требуется место для хранения входящих данных
- Redshift основан на мультиверсионной согласованности, поэтому необходимо сохранить много дополнительных блоков, чтобы транзакции имели доступ к правильным данным.
Переход между типами узлов повлияет на способ хранения данных на диске - вы переходите от 1 (?) Узла с 16 срезами к 5 узлам с 10 срезами. Если у вас есть таблицы распределения ВСЕ, они будут храниться 5 раз, а не один раз. Размер базы данных в этом новом кластере может не совпадать - он может быть меньше или больше.
Я ожидаю, что реальный предел заключается в организации данных в новом кластере, как они поступают из старого кластера , Как я уже упоминал, данные в полете несжатые, вероятно, именно этот рабочий набор вызывает проблему.
Вам нужно больше кластера для такого количества данных.