Как отладить OOMKilled проблемы с Kubernetes / Почему traefik pod не работает - PullRequest
0 голосов
/ 26 февраля 2020

Я тестирую локальное приложение, которое использует службу, которая оборачивает внешнюю службу soap.

Когда я делаю запрос на получение данных за 1 неделю, все работает нормально.

Но когда я делаю запрос на получение данных за 1 месяц, мой веб-сервер / обратный прокси-сервер падает (traefik)

Когда я проверяю модули, я получаю:

SGE:

Last State:     Terminated
  Reason:       OOMKilled
  Exit Code:    137
  Started:      Wed, 26 Feb 2020 09:54:29 +0100
  Finished:     Wed, 26 Feb 2020 15:48:13 +0100

Traefik:

    Last State:     Terminated
      Reason:       OOMKilled
      Exit Code:    137
      Started:      Thu, 13 Feb 2020 15:53:10 +0100
      Finished:     Wed, 26 Feb 2020 15:48:13 +0100

Я проверил использование памяти / ЦП каждого контейнера с Grafana. Я не могу найти никаких признаков ненормальной активности.

Вот скриншот для памяти Использование:

Traefik

SOAP Wrapper API

В конфигурации traefik не имеет ограничений по ресурсам. Служба SGE имеет следующие ограничения:

      resources:
            # keep request = limit to keep this container in guaranteed class
            limits:
              cpu: 500m
              memory: 400Mi
            requests:
              cpu: 200m
              memory: 200Mi

Моя виртуальная машина имеет 800 МБ свободной памяти во время простоя, поэтому это не должно быть проблемой.

Почему Traefik падает? Я не понимаю, что происходит, и как мне это предотвратить.

Есть идеи ???

...