В настоящее время я тестирую, как Azure Kubernetes обрабатывает аварийное переключение для StatefulSets. Я смоделировал сетевой раздел, запустив sudo iptables -A INPUT -j DROP
на одном из моих узлов, не идеально, но достаточно хорошо, чтобы протестировать некоторые вещи.
1). Как я могу использовать диски, подключенные к отказавшему узлу? Есть ли способ вручную освободить диск и сделать его доступным для перенесенного модуля? После принудительного удаления ресурсы высвобождаются навсегда, иногда это занимает более часа.
2). Если я удаляю узел из кластера, все ресурсы освобождаются через определенное время. Проблема в том, что на панели инструментов Azure он по-прежнему отображает мой кластер как использующий 3 узла, даже если я удалил один. Есть ли способ вручную добавить удаленный узел обратно или мне нужно каждый раз перестраивать кластер?
3). Я совершенно определенно не хочу использовать ReadWriteMany
.
По сути, я хочу, чтобы мои модули StatefulSet завершили работу и отсоединили соответствующие диски, а затем перенесли на новый узел в случае сетевого раздела или сбой узла. Я знаю, что блоки будут завершены в случае восстановления из сетевого раздела, но я хочу сам контролировать процесс или, по крайней мере, раньше.