Спасибо за разъяснения.Выполнение этого традиционным способом ETL с серверами имеет некоторые недостатки.Либо вам придется большую часть времени бездействовать, либо вам придется каждый раз ждать, пока машина будет создана по требованию - в точности, как вы говорите.
Для Firehose, IMO, это интереснокогда у вас есть много данных в режиме реального времени для приема.Что касается AWS Glue, для меня это больше похоже на «управляемый» Apache Spark, поэтому, если у вас есть логика обработки данных для реализации в большом количестве пакетных данных, это может быть интересно.Но, по твоему описанию, дело не в этом, верно?
Подводя итог, если вы думаете, что объем вставленных данных всегда будет по-прежнему составлять несколько мегабайт, для меня самое простое решение - лучшее, то есть Kinesis -> Lambda -> RDS, возможно, с другой Lambda.для резервного копирования данных на S3 (срок хранения Kinesis ограничен 7 днями).Это особенно интересно с точки зрения ценообразования - очевидно, у вас не так много данных, Lambda выполняется по требованию, например, путем пакетирования 1000 записей Kinesis, так что это хороший повод сэкономить немного денег.В противном случае, если вы ожидаете, что у вас будет все больше и больше данных, использование версии «Firehose -> Lambda» будет для меня более подходящим, поскольку вы не загружаете базу данных большим объемом данных одновременно.