Я использую Heketi Cli для динамического предоставления томов на GlusterFS в Kubernetes.Я сталкиваюсь с проблемой, когда узлы, на которых работают GlusterFS и heketi, теряются и перезапускаются.Я заметил, что у Heketi возникают проблемы с перезапуском при сбое узлов.
Таким образом, сценарий таков:
- Развертывание Heketi и набор демонов GlusterFS работают на тех же узлах.
- Узел потерян.
- Развертывание Heketi перемещается на другой узел, но, поскольку GlusterFS не работает, происходит сбой и происходит переход в режим сбоя контейнера.
- Демон GlusterFS возвращается, но Хекети все еще отключен и жалуется на «неизвестную файловую систему glusterfs»
Итак, вопросы:
Есть ли способ задержать аварийное завершение работы Heketi в случае, если GlusterFS не работает, возможно, некоторые переменные среды передаются в модуль Heketi?
Почему контейнер heketi не перезапускается после сбоя.Является ли нормальное поведение модуля перезагрузкой и продолжением попытки?