У меня есть множество моделей ML, которые я буду сохранять / загружать при обучении, большинство из них в реализациях sklearn
на Python 3, Windows, но некоторые в xgboost
и keras
.
Существуют ли общие рекомендации по сохранению всех моделей в разных реализациях в едином формате? Я бы хотел, чтобы сохраненные модели хранили как можно больше информации (параметры модели, имена элементов и т. Д. c, если это возможно). Документация sklearn
предлагает сохранить в joblib
, а xgboost
предлагает сохранить в JSON с помощью метода .save_model()
. Интересно отметить, что сохраненные модели JobLib очень малы (всего несколько КБ), а xgboost JSON может иметь несколько сотен МБ.