Воспроизводимость модели Python XGboost - PullRequest
0 голосов
/ 24 октября 2019

Я пытаюсь убедиться, что мои модели Python xgboost одинаковы при генерации с использованием одинаковых [random_state, seed, входные функции, параметры модели]. Однако, хотя деревья решений в точности совпадают (оцениваются визуально с использованием plot_tree), двоичные файлы, которые хранятся на двух разных машинах Windows, различаются.

Я сравниваю модели с помощью команды «diff». Модели одинаковы при условии, что они работают на одной и той же машине, но они меняются, когда я переключаю машины.

Пока я пробовал:

Использование маринада вместоsklearn.externals.joblib для сброса моделей. создавая одинаковую среду conda для двух машин. Есть идеи, что может быть причиной этого?

...