В настоящее время я решаю задачу масштабного обслуживания моих моделей тензорного потока.Насколько я знаю, рекомендуемое решение - использовать стандартный TensorFlow ModelServer .Общие требования довольно хорошо справляются с этим - но я хочу большего.Я хочу уменьшить количество передаваемых данных, проанализировав такой параметр, как «предел», чтобы определить первые n logits + вероятности возврата.
В ходе моего исследования я определил следующие решения:
1) Создайте более продвинутый SignatureDef во время построения модели.
2) Настройте базовый тензор потока / обслуживание с упомянутой функциональностью.
3) Обслуживайте модель со стандартнымTensorflow Modelserver и создайте сервис постобработки для реструктуризации соотв.отфильтруйте результат заранее определенным способом.
Может ли кто-нибудь более опытный, чем я, подробно рассказать о моем вопросе?- CodeSnippets или ссылки было бы здорово.
Заранее спасибо.