У нас есть сервер Flask, который делает вызовы gRP C для POD Tensorflow Serving POD (который использует официальный образ tf-Обслуживание docker), который обслуживает около 20 моделей тензорного потока. Микросервис Flask и микросервис Tf-Serving развернуты в Kubernetes. Для 0,5-1% запросов от Flask к Tf-Serving сервер Flask выдает RpcError - StatusCode.DEADLINE_EXCEEDED
Существует похожая проблема на github: https://github.com/tensorflow/serving/issues/1265. Пожалуйста, помогите мне решить эту проблему.