Google Cloud Поток данных застрял с повторяющейся ошибкой 'Ошибка синхронизации модуля ... не удалось "StartContainer" для "SDK" с CrashLoopBackOff' - PullRequest
0 голосов
/ 12 декабря 2018

SDK: Apache Beam SDK для Go 0.5.0

Наша работа на Golang в течение нескольких недель успешно выполнялась для потока данных Google Cloud.Мы не делали никаких обновлений для самой работы, и версия SDK, кажется, такая же, как была.Прошлой ночью это не удалось, и я не знаю точно, почему.Достигается ограничение в 1 час, и задание отменяется из-за отсутствия активности работника.

При просмотре журналов Stackdriver единственное, что я могу заметить, это повторяющиеся ошибки с Error syncing pod...failed to "StartContainer" for "sdk" with CrashLoopBackOff

Кажется, что почему-то не удается синхронизировать модуль (?) И, таким образом, он ждет 5 минут, прежде чем повторить попытку.

Может ли кто-нибудь пролить свет на то, что может быть причиной этого, и как мы могли бы найти дополнительную информацию?или диагностируйте причину проблемы?

Примечание. Я проверил состояние потока данных Google Cloud, и в службе не было никаких сбоев.

Ответы [ 2 ]

0 голосов
/ 09 апреля 2019

Я столкнулся с той же проблемой сегодня и следовал инструкциям здесь , чтобы создать свой собственный образ, перенес его в публичный репозиторий и использовал его с опцией --worker_harness_container_image, и это сработало для меня.

0 голосов
/ 12 марта 2019

У нас было что-то похожее, и мы обнаружили, что это была неспособность запустить рабочих (для нас это связано с проблемой slf4j, но это может быть что угодно, что мешает рабочему запускаться на любом языке).

Есливы просматриваете журналы Stackdriver (просмотрите журналы в пользовательском интерфейсе и щелкните по ссылке, чтобы перейти к Stackdriver), вы сможете просмотреть worker_startup журналы.

...