Рекомендации по работе с глубокими нейронными сетями для YouTube состоит из двух компонентов: создание кандидатов, ранжирование.
Два самостоятельных DNN.
Во время обслуживания деталь candidate generate
просто использует изученный вектор встраивания, чтобы найти K-ближайшего соседа.
А ближайших соседей кормят вторым компонентом, ранжированием-DNN.
С этой двухэтапной структурой можно все еще использовать Tensorflow Serving?
Если да, то как можно структурировать тензорный поток, обслуживающий систему рекомендаций?
- Будет два обслуживающих сервера тензор потока?
- Будет ли один обслуживающий сервер tenserflow, содержащий две модели?
- Если есть два обслуживающих сервера tenorflow, можно ли настроить их сетевую структуру, следуя приведенному ниже графику потока данных? (один обслуживающий сервер тензорного потока передает свой вывод следующему)