EKS Random «Ошибка: ErrImagePull» «Тайм-аут ввода-вывода» при извлечении изображений - PullRequest
2 голосов
/ 07 августа 2020

Работает AWS «Управляемые узлы» для кластера EKS в 2 зонах доступности.

Всего 3 узла. Я получаю случайные таймауты при попытке опустить контейнеры.

Это было так сложно отследить, потому что это действительно работает (иногда), так что это не похоже на блокировку ACL или группу безопасности.

Когда я sh попадаю в узлы, иногда я могу вытащить изображение вручную, а иногда нет. Когда я выполняю запросы curl curl -I https://hub.docker.com, иногда требуется 2 минуты, чтобы получить ответ. Я предполагаю, что поэтому время ожидания изображений истекает.

Я не знаю способа увеличить время ожидания для k8s, чтобы вытащить изображение, но также не могу понять, почему задержка такая плохо выполняет запрос curl.

Любые предложения приветствуются.

FYI, рабочие узлы в Private Su bnet, правильные маршруты к шлюзу NAT на месте. VP C Журналы расхода хорошие.

1 Ответ

1 голос
/ 07 августа 2020

Произвольный - сложнее всего отследить ?.

? Вы можете переместить свои изображения в частный реестр ECR или просто запустить реестр в своем кластере , чтобы откажитесь от того, что это проблема вашей сети Kubernetes. Запуск AWS CNI❓

Это также может быть ограничение скорости из docker самого концентратора . Используете ли вы один и тот же внешний IP-адрес NAT для извлечения из нескольких узлов / кластеров?:

Docker постепенно налагает ограничения скорости загрузки с возможным ограничением 300 загрузок за шесть часов для анонимных пользователей. Пользователи, вошедшие в систему, в это время не пострадают. Поэтому мы рекомендуем вам войти в Docker Hub как авторизованный пользователь. Для получения дополнительной информации см. Следующий раздел Как аутентифицировать запросы на вытягивание.

✌️

...