Я работаю над приложением, имеющим серверный контейнер, который обслуживает две модели машинного обучения для вывода на два разных порта.Клиентский контейнер отправляет поток кадров для вывода одновременно на оба порта.Связь между клиентом и сервером осуществляется через gRPC (двунаправленные потоковые RPC).Таким образом, сценарий выглядит так:
client1 ------sending request stream------------- service on port 9001
client2 ------sending request stream------------- service on port 9002
Выше сценарий происходит одновременно.Как я могу расставить приоритеты запросов, полученных на стороне сервера, в зависимости от того, какой клиент отправляет?То есть, если на сервере нет необходимых вычислений, как я могу расставить приоритеты для одного запроса над другим?
Любые подсказки будут очень полезны