При использовании ml-движка для онлайн-прогнозирования мы отправляем запрос и получаем результаты прогнозирования, это круто, но запрос обычно отличается от ввода модели, например:
- Категориальная переменная может бытьв запросе, но модель ожидает и целое число сопоставляется с этой категорией
- также для данной функции, нам может понадобиться создать несколько объектов, таких как разделение текста на две или более функций
- И нам может понадобитьсячтобы исключить некоторые функции из запроса, такие как постоянная функция, которая бесполезна для модели
Как вы справляетесь с этим процессом?Мое решение состоит в том, чтобы получить запрос с помощью приложения appengine, отправить его в pub / sub, обработать его в потоке данных, сохранить его в gcs и запустить облачную функцию для отправки обработанного запроса в конечную точку ml-engine и получения предсказанного результата.Это может быть чрезмерной разработкой, и я хочу избежать этого, если у вас есть какие-либо советы относительно моделей Xgboost, я буду признателен.