Как устранить неполадки, связанные с длительным уничтожением пакетов для GKE? - PullRequest
0 голосов
/ 24 октября 2019

При использовании helm upgrade --install я очень часто сталкиваюсь с таймаутами. Я получаю сообщение об ошибке:

UPGRADE FAILED
Error: timed out waiting for the condition
ROLLING BACK

Если я смотрю в журналах кластера GKE на GCP, я вижу, что когда это происходит, потому что выполнение этого шага занимает необычно много времени:

Killing container with id docker://{container-name}:Need to kill Pod

Я видел диапазон от нескольких секунд до 9 минут. Если я зайду в метаданные сообщения журнала, чтобы найти конкретный контейнер и посмотреть его журналы, то в них нет ничего, что указывало бы на разницу между ним и быстро уничтоженным контейнером.

1 Ответ

0 голосов
/ 24 октября 2019

Вы можете обратиться к этому руководству по устранению неполадок для общих проблем, связанных с Google Kubernetes Engine.

Как уже упоминалось, вам может понадобитьсяиспользуйте руководство ' для устранения неполадок приложения ' для дальнейшей отладки приложения или его контроллеров.

Я предполагаю, что вы проверили журналы (1) контейнера, который находится в соответствующем контейнере ИЛИ , описанный (2) (посмотрите на причину прекращения), используя приведенные ниже команды. Если нет, то вы также можете попробовать их, чтобы получить более ценную информацию.

1. kubectl logs POD_NAME -c CONTAINER_NAME -p
2. kubectl describe pods POD_NAME

Примечание: я видел похожую ветку обсуждения, о которой сообщалось на github.com оОшибка обновления руля. Вы также можете посмотреть там.

...