Мы столкнулись с довольно странной проблемой, из-за которой наши модули в одном из кластеров управляемых облаков GKE не работают, и это привело к множественным сбоям в работе в последние несколько недель.
На данный момент мы не уверены, зачем таким модулям переходить в это состояние и перезапускаться после нескольких попыток на том же узле и работать так же, как обычно, как будто ничего не произошло.
Как это можно сделатьбыть неисправным?