Я строю кластер мезо с нуля (использую Vagrant, который не относится к этой проблеме). ОС: Ubuntu 16.04 (верный) Настройка:
- Мастер -> Запускает ZooKeeper, Mesos-master, Marathon и Chronos
- Подчиненный -> Запускает Mesos-slave
Это мой сценарий подготовки для главного узла https://github.com/zeitgeist2018/infrastructure/blob/fix-marathon/provision/scripts/install-master.sh.
Мне удалось зарегистрировать de slave в Mesos, установить платформы Marathon и Chronos и запустить запланированные задания в Chronos. (как с docker, так и с командами оболочки), но я не могу заставить Marathon работать должным образом. Пользовательский интерфейс застревает в «Загрузка приложений», как только я его открываю, и когда я пытаюсь вызвать API, запрос зависает навсегда без ответа. В API я пытался получить простую информацию о марафоне и выполнить развертывание, оба с одинаковым результатом зависания. Я проверял логи Марафона, но не вижу там никакой ошибки. Всего несколько журналов, которые могут (или нет) быть подсказкой:
[2020-03-08 10:33:21,819] INFO Prompting Mesos for a heartbeat via explicit task reconciliation (mesosphere.marathon.core.heartbeat.MesosHeartbeatMonitor$$anon$1:marathon-akka.actor.default-dispatcher-6)
[2020-03-08 10:33:21,822] INFO Received fake heartbeat task-status update (mesosphere.marathon.core.heartbeat.MesosHeartbeatMonitor:Thread-87)
[2020-03-08 10:33:25,957] INFO Found no roles suitable for revive repetition. (mesosphere.marathon.core.launchqueue.impl.ReviveOffersStreamLogic$ReviveRepeaterLogic:marathon-akka.actor.default-dispatcher-7)