Don Ton 02 ноября 2019 41

Разница между вероятностями в R и Python (XGBoost)

Don Ton / 02 ноября 2019

Я пытаюсь запустить под Python .model XGboost binary classifier с R.

У меня точный порядок и кодировка для всех функций. Я проверил это 100 раз. Используемый код выглядит следующим образом:

bst = xgb.Booster() #init model

bst.load_model(path+"file.model") # load R model

features_dmatrix = xgb.DMatrix(features)

pred=bst.predict(features_dmatrix)

И у меня есть какая-то странная ситуация в двух аспектах:

вывод из функции предикта p(y=0|x). Мне просто интересно, почему, потому что модель R напрягает два класса (0 и 1), и она настроена на предсказание класса «1»;
есть 3% всех случаев с различиями между Python(1 выход) и R (оригинальный вывод). Разница в вероятностях: мин = -0,1846033;max = 0,0614451.

Не могли бы вы дать мне какой-нибудь опыт, объяснение или совет, как поступить. Заранее спасибо.

...