Я хочу запустить задание по быстрому на kubernetes, используя (постоянный) бэкэнд состояния, похоже, что сбой менеджеров задач не проблема, поскольку они могут спросить менеджера заданий, с какой контрольной точки они должны восстанавливаться, если я правильно понимаю.
Сбой менеджера по работе кажется немного сложнее. На этой странице flip-6 Я прочитал, что zookeeper необходим для того, чтобы знать, какую контрольную точку должен использовать менеджер по работе, чтобы восстановиться и для выборов лидера.
Если kubernetes перезапустит менеджер заданий при его сбое, есть ли способ для нового менеджера заданий возобновить работу, не настраивая кластер zookeeper?
Текущее решение, которое мы рассматриваем: когда kubernetes хочет убить менеджер заданий (потому что он хочет переместить его в другой виртуальный компьютер, например), а затем создать точку сохранения, но это будет работать только для корректного завершения работы.
Edit:
http://apache -flink-user-mailing-list-archive.2336050.n4.nabble.com / Flink-HA-with-Kubernetes-без-Zookeeper-td15033.html представляется интересным, но не имеет последующий