Автономная сервисная ткань и обслуживание узлов семян - PullRequest
0 голосов
/ 27 сентября 2018

Недавно я приобрел возможность установки резервных серверов для своей среды приложений с нуля.Я оцениваю Service Fabric как оркестратор приложений из-за его способности запускать исполняемые файлы вместо контейнеров, что является привлекательным краткосрочным вариантом.

Теперь я могу создать работающий кластер Service-Fabric через Terraform в AWS,Я могу создать один из ничего или добавить серверы в политику автоматического масштабирования, и новые серверы присоединятся к существующему кластеру.Если я уничтожу сервер, новый сервер, введенный в эксплуатацию группой автоматического масштабирования, будет инициализирован и снова присоединен к кластеру.

Однако я был разочарован, обнаружив, что Service Fabric не управляет автоматически заменой начальных узлов,даже если в кластере много других серверов.Уничтожение всех начальных узлов приводит к отказу всего кластера.Я хочу иметь возможность уничтожить любой сервер в любое время.

Существуют ли какие-либо рекомендуемые методы поддержки нескольких начальных узлов?Я действительно надеялся, что Service Fabric сохранит / проголосует за замену отсутствующих начальных узлов без моего вмешательства, но я не могу найти никакой документации на этот счет.Группа автоматического масштабирования и политика масштабирования могут в любой момент уничтожить начальный узел, а начальные узлы не заменяются автоматически.

Я могу самостоятельно управлять минимальным количеством начальных узлов, генерируя манифесты кластера изапуск обновлений конфигурации кластера.Я действительно надеялся на альтернативу с автоматическим управлением.

Кто-нибудь может дать какую-то информацию?

1 Ответ

0 голосов
/ 27 сентября 2018

Причиной такого поведения является то, что seed узлы или первичные узлы используются службами кластера Service Fabric.Под этим я подразумеваю, что такие службы, как ClusterManagerService, ImageStoreService, NamingService и т. Д., Запускаются только на первичных узлах, поэтому удаление первичных узлов вызывает сбой служб инфраструктуры кластера.

Пожалуйста, отметьте this и this для получения более подробной информации о первичных узлах, SKU и о том, как с этим можно управлять.

...