Существует ли предлагаемый способ обслуживания сотен моделей машинного обучения в Кубернетесе? Такие решения, как Kfserving , кажутся более подходящими для случаев, когда существует одна обученная модель или несколько ее версий, и эта модель обслуживает все запросы. Например, модель typeahead, которая является универсальной для всех пользователей.
Но есть ли предлагаемый способ обслуживания сотен или тысяч таких моделей? Например, модель typeahead, специально предназначенная для каждого пользователя data.
Самым наивным способом достижения чего-либо подобного является то, что каждый обслуживающий контейнер типа typehhead поддерживает локальный кеш моделей в памяти. Но тогда масштабирование до нескольких модулей будет проблемой, потому что каждый кэш является локальным для модуля. Таким образом, каждый запрос должен быть направлен к правильному модулю, который загрузил модель.
Также необходимо поддерживать такой реестр, в котором мы знаем, какой модуль загрузил, какая модель и выполнять обновления по вытеснению модели, кажется большим работы.