как определить свойства конфигурации искровой пряжи - PullRequest
0 голосов
/ 06 марта 2019

Мы используем кластер с открытым исходным кодом Apache spark, и у меня есть следующий конфигурационный файл.

Total 6 nodes.
32GB per node
16 PUS per node

Может кто-нибудь помочь мне найти правильные значения для следующих свойств.

yarn.nodemanager.resource.memory-mb

yarn.scheduler.maximum-allocation-mb

yarn.nodemanager.resource.cpu-vcores

Вышеуказанные свойства влияют на сроки выполнения работы?.

Спасибо.

1 Ответ

0 голосов
/ 06 марта 2019

yarn.nodemanager.resource.memory-mb, yarn.scheduler.maximum-alloc-mb указывает максимальное количество памяти, которое может быть выделено для контейнера, а yarn.nodemanager.resource.cpu-vcores указывает максимальное количество ядер, которое может бытьвыделено для контейнера.

По умолчанию пряжа выделит одно ядро ​​процессора и 1 ГБ памяти для контейнера (исполнитель в искре), а также по умолчанию пряжа создаст 2 контейнера (2 исполнителя) для приложения spark.

Мы можем переопределить количество ядер и объем памяти для исполнителя, используя следующие свойства --conf spark.executor.memory = 4g, --conf spark.executor.cores = 2

Такжемы можем переопределить число исполнителей для приложения spark, используя свойство ниже --conf spark.executor.instances = 3

...