Каков наилучший способ обслуживания модели LSTM с использованием сервировки TensorFlow?
Я хотел бы иметь возможность сделать следующее:
Время получения t
данные (x_t)
вместе с (c_t-1, h_t-1)
Обновление состояний ячеек LSTM с учетом полученных.(Поскольку модель запускается для многих пользователей, мы хотим получить последнее состояние пользователей и обновить модель)
Получить прогноз модели y_t
и (c_t, h_t)
(если пользователь приходитназад, мы снова можем легко сделать прогноз).
Однако, кажется, что это еще не возможно в текущей инфраструктуре.
Самый простой обходной путь - это обслуживание модели Keras, где мы вызываем метод reset_states
перед каждым прогнозом, в контейнере Flask.Но это похоже на взлом.Мне было интересно, что было бы наиболее эффективным способом решения такой проблемы?
См. Также проблему: Обслуживание Tensorflow - Stateful LSTM