Можно ли совместно использовать компоненты графа в тензорном потоке, обслуживающем обслуживаемые модели / модели?Или, может быть, составить несколько моделей?
Конкретный пример, с которым я работаю, - это набор многих классификаторов текста, основанных на встраивании одних и тех же слов.Эти вложения слов составляют 99% параметров модели каждого классификатора, и было бы здорово не дублировать их в памяти или на диске (таким образом, мы обслуживаем сотни классификаторов).
Янадеясь, что есть какой-то способ использовать те же вложения для преобразования входных токенов, а затем передать их другим моделям для классификации без необходимости многократных поездок по сети.
См. существующее и желаемое поведение здесь.