Да, вышеприведенная стратегия не просто хороша, ее good
. Я использую его в производстве system
, и он отлично работает, хотя вы должны тщательно продумать эту стратегию, чтобы убедиться, что она решает ваш сценарий использования effectively
и efficiently
.
Вот несколько моментов, что я имею в виду под эффективным и результативным.
- Убедитесь, что у вас есть наиболее эффективный способ идентифицировать записи, которые нужно отправить на
Redshift
, что означает идентификацию потенциальных записей с оптимизированными запросами, включающими CPU
, Memory
. - Убедитесь, что вы используете оптимизированный способ отправки идентифицированного на
redshift
, который включает оптимизацию размера данных, так чтобы он использовал минимальные значения storage
и network bandwidth
. например, сжатие и gzip
CSV-файлы, чтобы он занимал минимальный размер в S3
хранилище и сохранял network
пропускную способность. - Попробуйте выполнить
copy redshift
запросов так, чтобы он выполнялся параллельно.
Надеюсь, это поможет.