Я разрабатываю приложение, для которого ввод представляет собой большой текстовый файл (размер колеблется от 1 до 30 ГБ), загружаемый в корзину S3 каждые 15 минут. Он разбивает файл на не более мелких и копирует эти файлы в 3 разных сегмента S3 в 3 разных регионах AWS. Затем 3 приложения-загрузчика считывают эти n файлов из соответствующих блоков s3 и загружают данные в соответствующий аэрокосмический кластер.
Я думаю использовать лямбда-функцию AWS для разделения файла, а также для загрузки данных. Недавно я наткнулся на функцию шага AWS, которая также может служить цели на основе того, что я прочитал. Я не уверен, какой из них пойти и какой будет дешевле с точки зрения цены. Любая помощь приветствуется.
Заранее спасибо!