С точки зрения Spark, действительно ли планировщики пряжи отличаются? - PullRequest
0 голосов
/ 20 февраля 2019

Пряжа имеет два известных планировщика, Fair Scheduler и Capacity Scheduler.Грубо говоря, Capacity делит кластер на заранее определенные очереди, таким образом, гарантируя ресурсы для каждой очереди, планировщик Fair также делит кластер на очереди и равномерно распределяет ресурсы между очередями и внутри очереди.

Теперь, рассматривая детали каждого планировщика, мы видим, что:

  1. Каждый из них позволяет неравномерное разбиение кластера (весовые коэффициенты и доля ресурсов для Fair и процентное соотношение вемкость)
  2. Каждый из них поддерживает как FIFO, так и FAIR в планировании приложений очереди
  3. Оба поддерживают вычисления использования ресурсов на основе памяти и DRF

Я думаю, что обаони «выросли» в эту ситуацию, где функции были добавлены к каждому из них.Но на сегодняшний день, есть ли разница между ними?

PS Я задаю вопрос из контекста , использующего Yarn для управления Spark

РЕДАКТИРОВАТЬ: послеБыл предложен дубликат, я объясню, почему, хотя он и похож, он не полностью отвечает на вопрос, во-первых, ответы неточны, например, заявки назначаются очередям, а не заданиям.Наиболее информативным ответом является таблица сравнения, которая на самом деле взята из quora answer , она верна, но датируется 2014-2016 гг., Что, хотя и учитывает прогресс в разработке, делает ее неактуальной.

1 Ответ

0 голосов
/ 20 февраля 2019

Nodel Labels является основным.Если вы хотите запускать определенные задания с набором компьютеров, которые имеют дополнительные возможности (графические процессоры, лицензии на программное обеспечение, оборудование более высокого класса ...), вам необходимо использовать Capacity Scheduler.Fair Scheduler может получить это позже, но AFAIK все еще выполняется.

Соответствующие JIRA:

Что касается истории, планировщик емкости возник из Yahoo!затем был поддержан HortonWorks, когда Yahoo!раскрутил HortonWorks.Cloudera инвестировала в Fair Scheduler.Я не уверен, какое будущее у объединения HortonWorks и Cloudera.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...