Кроме того, что это ограничение роли не выполняется?
Роли, также называемые «ролями ресурсов», помогают отделить разные группы ресурсов друг от друга.Например, в стандартном кластере DC / OS все ресурсы общедоступных узлов зарезервированы для роли slave_public
.
Когда Marathon получает предложение ресурсов, он принимает во внимание роль, для которой эти ресурсы зарезервированы,В вашем случае Marathon отклонил одно предложение ресурсов, поскольку ресурсы не принадлежали роли по умолчанию *
.
. Подробнее о ролях ресурсов см. В документации Mesos . * 1013.*
Я проверил вывод конечной точки /mesos/slaves
из списка и обнаружил, что в вашем кластере все агенты, кроме одного, не имеют доступных ресурсов для вашей службы:
10.11.17.23
, 10.11.17.250
, 10.11.17.41
, 10.11.17.72
и 10.11.17.123
имеют только 2 процессора.
10.11.16.12
имеет 4 процессора, но все они зарезервированы для роли spave_public
.
10.11.17.46
имеет всего 8 ЦП, 2,5 ЦП зарезервированы для роли slave_public
, а оставшихся 5,5 должно быть действительно достаточно для /my-service
.Похоже, по какой-то причине этот агент Mesos не отправляет предложения ресурсов Мастеру.
Проверьте журналы этого агента (journalctl -u dcos-mesos-slave
) на наличие ошибок.Тот факт, что он был зарегистрирован в кластере на 4 часа позже, чем другие агенты (13:39:44 против 09:42:51), немного подозрительно.
Проверьте главные журналы (journalctl -u dcos-mesos-master
), еслиMesos отправляет любые предложения ресурсов от этого агента на Марафон.
Проверьте журналы марафона (journalctl -u dcos-marathon
), если Марафон получает предложения ресурсов от этого агента и если да, причина отклонения.
Эта статья в блоге Месосферы может дать вам еще несколько идей.