Я новичок в AWS EMR и пытаюсь создать кластер для обработки данных из S3.
У меня есть сценарий использования, когда в кластер каждый час поступает инкрементная подача данных.Прямо сейчас я запускаю кластер с Hadoop и spark.После обработки данных я завершаю кластер.
Это допустимый вариант использования для хранения данных на hadoop и обработки их с помощью spark?Любые ссылки будут великолепны.