Я работаю над приложением обработки данных, размещенным в виде веб-службы на EC2, каждую секунду создается небольшой файл данных (менее 10 КБ) в формате .csv.
Постановка задачи:
Архивируйте все файлы данных, сгенерированные в Amazon Glacier.
Мой подход:
Как файлы данных очень маленькие. Я сохраняю файлы в AWS Kinesis и через несколько часов сбрасываю данные в S3 (потому что не могу найти прямой способ передачи данных из Kinesis в Glacier) и, используя управление жизненным циклом S3, в конце дня архивирую все объекты в Glacier ,
Мои вопросы:
Есть ли способ передачи данных на Glacier непосредственно из Kinesis?
Можно ли настроить Kinesis для сброса данных в S3 / Glacier в конце дня? Есть ли какое-то время или ограничение памяти, до которого Kinesis может хранить данные?
Если Kinesis не может передать данные в Glacier напрямую. Есть ли обходной путь для этого типа - могу ли я написать лямбда-функцию, которая может получать данные из Kinesis и архивировать их в Glacier?
Можно ли объединить все файлы .csv на уровне Kinesis, S3 или Glacier?
Подходит ли Kinesis для моего использования? Могу ли я использовать что-нибудь еще?
Буду признателен, если кто-то найдет время, ответит на мои вопросы и укажет на некоторые ссылки. Пожалуйста, дайте мне знать, если в моем подходе есть изъян или есть лучший способ сделать это.
Спасибо.