kirylm,
Если вы используете версию Apache Mesos (DC / OS) для Mesosphere, у меня есть учебник, который включает в себя пример запуска службы Spark External Shuffle на Mesos и включает в себя пример задания Sparkкоторый использует службу внешнего перемешивания.
Имейте в виду, что при запуске службы внешнего перемешивания Spark на Mesos по умолчанию будет использоваться только хранилище, доступное через изолированную программную среду Mesos (которая может быть слишком маленькой).Если вы хотите, чтобы служба shuffle использовала временное хранилище (тома Mesos MOUNT), вам необходимо запустить службу Spark shuffle с такими параметрами:
"container": {"type":" DOCKER "," volume ": [{" persistent ": {" size ": 99500," type ":" mount "}," mode ":" RW "," containerPath ":" spark_local_dir "}],
Учебное пособие по стеку SMACK можно найти здесь:
https://github.com/gregpalmr/smack-stack-tutorial
Основной сценарий оболочки BASH, который запускает диспетчер Spark, Spark ExternalСервис Shuffles и сервер истории Spark расположены здесь:
https://github.com/gregpalmr/smack-stack-tutorial/blob/master/scripts/start-smackstack.sh
Пример отправки Spark, использующей службу внешнего перемешивания Spark, находится здесь:
https://github.com/gregpalmr/smack-stack-tutorial/blob/master/scripts/run-sample-spark-hdfs-job.sh
Надеюсь, это поможет,
Грег Палмер, Мезосфера