Я играл с XGBoost (в частности, с XGBRegressor) в Python. Я использовал его, чтобы создать модель с 200 оценщиками, max_depth из 14. Он был обучен примерно на 2M точках тренировочных данных. Он имеет только 3 функции и 1 выход. Модель очень точная, и я также проверил, что она не переоснащена. Но когда я сохраняю модель, она огромна! Он занимает 160 МБ на диске, и когда я конвертирую его в C (используя Treelite), он составляет 490 МБ на диске. Я должен наконец развернуть его на машинах без python, и он должен взаимодействовать с другим программным обеспечением, которое может загружать только файлы C. Такой огромный размер является серьезной проблемой при реализации.
Что-то я не правильно делаю? Или модели xgboost обычно такие большие? Я просматривал в Интернете, но не смог найти эту проблему.
Я использую Python 3.7 и Anaconda для создания моих моделей. Я не уверен, какие еще детали я должен опубликовать.