EMR: невозможно выполнить шаги параллельно - PullRequest
0 голосов
/ 07 июня 2018

Я пытаюсь выполнить несколько шагов EMR параллельно.Я видел другие вопросы, касающиеся этой проблемы на SO, а также варианты поиска в Google.Итак, что я пробовал:

  • Настройка CapacityScheduler с набором очередей
  • Настройка FairScheduler
  • Попробуйте использовать конвейеры данных AWS с PARALLEL_FAIR_SCHEDULING, PARALLEL_CAPACITY_SCHEDULING

1 Ответ

0 голосов
/ 10 декабря 2018

Возможно, уже поздно, но надеюсь, что это будет полезно.

Spark предоставляет опцию, которая указывает, будет ли вызывающий (шаг) ждать или не завершить искра приложения после отправки.Вы можете установить это значение как false, тогда шаг AWS emr будет отправлен и вернется немедленно.

spark.yarn.submit.waitAppCompletion: "false"

...