У меня есть случай использования, когда файл S3 выступает в качестве входных данных для пакетного приложения (написанный на Java), а размер файла достиг 10 ГБ.
В настоящее время этот файл S3 сохраняется локально, а затем обрабатывается,Проблема с этим подходом заключается в том, что файл содержит данные клиента, поэтому он не защищен в локальной файловой системе (в основном он не придерживается правила безопасности шифрования в состоянии покоя).
Мы искали несколько подходов
- шифрование диска: оно может замедлить всю пакетную обработку, поскольку генерирует временные файлы.Выполняется POC.
- Строковые пакетные входные файлы построчно и выполняется обработка в памяти: выполняется много сетевых вызовов и замедляется приложение
- шифрует поля клиента во входных файлах:неосуществимо, так как файлы иногда создаются вручную.
Может иметь инструмент для шифрования файла, созданного вручную, но затем он не может быть масштабирован для всех клиентов, требует изменения в SOP.
Есть лиЛюбой другой безопасный способ обработки больших красных файлов данных, поступающих с S3?