Администрирование кластера Dask.distributed - PullRequest
0 голосов
/ 11 января 2019

Я настраиваю кластер Dask Python на работе (30 машин, в среднем по 8 ядер). Люди используют только часть мощности своего процессора, поэтому dask-workers будет работать в фоновом режиме с низким приоритетом. Все рабочие слушают dask-scheduler на моем главном узле. Он отлично работает, если только я использую его, однако он будет использоваться несколькими людьми одновременно, поэтому мне нужно иметь возможность администрировать этот кластер:

  • Аутентификация пользователей, отклонение неизвестных
  • Укажите, кто подал какую работу
  • Ограничить количество отправленных заданий на пользователя
  • Ограничение времени ожидания для вычислений для каждого задания
  • Убить любую работу в качестве администратора

dask.distributed из коробки предоставляет немного функциональности, описанной выше. Не могли бы вы посоветовать какое-нибудь решение (может быть гибрид Dask + что-то)?

1 Ответ

0 голосов
/ 20 февраля 2019

Обычно люди используют диспетчер кластеров, такой как Kubernetes, Yarn, SLURM, SGE, PBS или что-то еще. Эта система обрабатывает аутентификацию пользователей, управление ресурсами и так далее. Затем пользователь использует один из проектов Dask-kubernetes, Dask-yarn, Dask-jobqueue для создания собственного краткосрочного планировщика и рабочих в кластере по мере необходимости.

...