AWS EMR искра на hadoop с хранением данных - PullRequest
0 голосов
/ 26 сентября 2018

Я новичок в AWS EMR и пытаюсь создать кластер для обработки данных из S3.

У меня есть сценарий использования, когда в кластер каждый час поступает инкрементная подача данных.Прямо сейчас я запускаю кластер с Hadoop и spark.После обработки данных я завершаю кластер.

Это допустимый вариант использования для хранения данных на hadoop и обработки их с помощью spark?Любые ссылки будут великолепны.

...