Причина ответа задачи Mesos-Master: REASON_AGENT_REMOVED в aws ведомом устройстве EC2 - PullRequest
0 голосов
/ 04 мая 2020

Мне удалось запустить успешную задачу mesos (версия 1.9) с zookeeper, master и slave в одном экземпляре EC2.

mesos-execute --master=INSTANCE_EXTERNAL_IP:5050 --name="echo-test" --command=echo "Hello, World"

Я получаю

  source: SOURCE_EXECUTOR
Received status update TASK_RUNNING for task 'echo-test'
  source: SOURCE_EXECUTOR
Received status update TASK_FINISHED for task 'echo-test'
  message: 'Command exited with status 0'
  source: SOURCE_EXECUTOR

И пользовательский интерфейс Mesos показывает задачу Finished

Когда я настраиваю mesos slave на другом экземпляре EC2, а пользовательский интерфейс mesos-master показывает агента и доступные ресурсы, я продолжаю получать:

Received status update TASK_UNREACHABLE for task 'echo-test'
  message: 'health check timed out'
  source: SOURCE_MASTER
  reason: REASON_AGENT_REMOVED

Все руководства по настройке mesos-slave говорят об отключении mesos-master и zookerper services и добавить IP-адрес мастера в файл / ect / mesos / zk . Я получаю IP для мастера, запустив hostname -f.

Может кто-нибудь помочь мне отладить это? Я новичок в мезо и очень ценю любую помощь.

Большое спасибо.

...