Я пытаюсь убедиться, что мои модели Python xgboost одинаковы при генерации с использованием одинаковых [random_state, seed, входные функции, параметры модели]. Однако, хотя деревья решений в точности совпадают (оцениваются визуально с использованием plot_tree), двоичные файлы, которые хранятся на двух разных машинах Windows, различаются.
Я сравниваю модели с помощью команды «diff». Модели одинаковы при условии, что они работают на одной и той же машине, но они меняются, когда я переключаю машины.
Пока я пробовал:
Использование маринада вместоsklearn.externals.joblib для сброса моделей. создавая одинаковую среду conda для двух машин. Есть идеи, что может быть причиной этого?