У меня проблемы с nginx-lego (я знаю, что он устарел) и автоскалером узла.Мне пришлось масштабировать вручную через HPA и временно исправлять minReplicas до большого числа.Все масштабировалось хорошо, были добавлены новые узлы из-за увеличения количества модулей.
После всплеска трафика я вернул число в нормальное состояние (что очень мало), и я вижу много ошибок шлюза 502.После того, как я проверил журнал модуля nginx-lego, я смог увидеть, что множество запросов отправлялось на модули, которых больше нет (соединение отказано или нет маршрута к хосту).
2018/11/21 17:48:49 [error] 5546#5546: *6908265 connect() failed (113: No route to host) while connecting to upstream, client: 100.112.130.0, server: xxxx.com, request: "GET /public/images/social-instagram.png HTTP/1.1", upstream: "http://X.X.X.X:3000/public/images/social-instagram.png", host: "xxxx.com", referrer: "https://outlook.live.com/"
2018/11/21 17:48:49 [error] 5409#5409: *6908419 connect() failed (113: No route to host) while connecting to upstream, client: 10.5.143.204, server: xxxx.com, request: "GET /public/images/social-instagram.png HTTP/1.1", upstream: "http://X.X.X.X:3000/public/images/social-instagram.png", host: "xxxx.com"
2018/11/21 17:48:49 [error] 5546#5546: *6908420 connect() failed (111: Connection refused) while connecting to upstream, client: 10.5.143.204, server: xxxx.com, request: "GET /public/images/social-facebook.png HTTP/1.1", upstream: "http://X.X.X.X:3000/public/images/social-facebook.png", host: "xxxx.com"
Есть идеи, что может быть не так?
Я думаю, что исправление minReplicas, вероятно, не лучший способ сделать это, но я знал, что будет всплеск иУ меня не было лучшего представления о том, как предварительно масштабировать весь кластер.