Question

Я разрабатываю приложение, которое должно читать текстовый файл из S3 каждые 15 минут, анализировать данные, разделенные |и загрузите эти данные в аэрокосмический кластер в трех разных регионах.Размер файла может варьироваться от 0 до 32 ГБ, а количество записей в нем может составлять от 5 до 130 млн.

Я планирую развернуть пользовательский процесс Java в каждом регионе AWS, который будет загружать файл изS3 и загружает в аэроспайк, используя несколько потоков.

Я только что наткнулся на клей AWS.Кто-нибудь может сказать мне, могу ли я использовать клей aws, чтобы загрузить этот большой кусок данных в аэроспайк?или любая другая рекомендация по созданию эффективного и производительного приложения?

Заранее спасибо!

Ronen Botzer · Answer 1 · 21 декабря 2018

AWS Glue выполняет извлечение, преобразование, а затем загружает в RedShift, EMR или Athena.Вместо этого вам следует взглянуть на AWS Data Pipeline, используя ShellCommandActivity для запуска ваших данных s3 посредством извлечения и преобразования и записи преобразованных данных в Aerospike.

Можно ли использовать aws-клей для загрузки данных в аэроспайк?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Можно ли использовать aws-клей для загрузки данных в аэроспайк?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы