Как правило, модели xgboost имеют большой размер (МБ на диске)? - PullRequest
0 голосов
/ 04 мая 2020

Я играл с XGBoost (в частности, с XGBRegressor) в Python. Я использовал его, чтобы создать модель с 200 оценщиками, max_depth из 14. Он был обучен примерно на 2M точках тренировочных данных. Он имеет только 3 функции и 1 выход. Модель очень точная, и я также проверил, что она не переоснащена. Но когда я сохраняю модель, она огромна! Он занимает 160 МБ на диске, и когда я конвертирую его в C (используя Treelite), он составляет 490 МБ на диске. Я должен наконец развернуть его на машинах без python, и он должен взаимодействовать с другим программным обеспечением, которое может загружать только файлы C. Такой огромный размер является серьезной проблемой при реализации.

Что-то я не правильно делаю? Или модели xgboost обычно такие большие? Я просматривал в Интернете, но не смог найти эту проблему.

Я использую Python 3.7 и Anaconda для создания моих моделей. Я не уверен, какие еще детали я должен опубликовать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...