В рамках ежедневной загрузки в Redshift у меня есть несколько таблиц, которые нужно удалить и полностью загрузить все из них (размер данных небольшой, менее 1 миллиона).
У меня вопрос, какая изниже две стратегии лучше с точки зрения использования процессора и памяти в Redshift: 1) усечение данных 2) DROP и воссоздание таблицы.
Если я усекаю таблицы, я должен выполнять Vacuum для таблиц каждый день, так как я прочитал, чточастое удаление и повторное создание таблиц в базе данных приводит к фрагментации страниц.
И в одной из таблиц я хотел бы включить сжатие.Итак, есть ли недостаток в создании DDL с кодированием каждый день.
Пожалуйста, сообщите!Спасибо!