Я использую службу тензорного потока на графических процессорах с --enable-batching=true
.
Однако я немного запутался с max_batch_size
в batching_config.txt
.
Мой клиент отправляет входной тензор с тензорной формой [-1, 1000]
в одном запросе gRPC, dim0 колеблется от (0, 200]
. Я установил max_batch_size = 100
и получил ошибку:
"Код возврата вызова gRPC: 3: размер задачи 158 превышает максимальный пакет
размер 100 "
"Код возврата вызова gRPC: 3: размер задачи 162 превышает максимальный пакет
размер 100 "
Похоже, max_batch_size
ограничивает dim0 одного запроса, но тензор потока объединяет несколько запросов в пакет, я думал, что это означает сумму номеров запросов.