Я пытаюсь запустить под Python .model
XGboost
binary classifier
с R
.
У меня точный порядок и кодировка для всех функций. Я проверил это 100 раз. Используемый код выглядит следующим образом:
bst = xgb.Booster() #init model
bst.load_model(path+"file.model") # load R model
features_dmatrix = xgb.DMatrix(features)
pred=bst.predict(features_dmatrix)
И у меня есть какая-то странная ситуация в двух аспектах:
- вывод из функции предикта
p(y=0|x)
. Мне просто интересно, почему, потому что модель R напрягает два класса (0 и 1), и она настроена на предсказание класса «1»; - есть 3% всех случаев с различиями между
Python
(1 выход) и R
(оригинальный вывод). Разница в вероятностях: мин = -0,1846033;max = 0,0614451.
Не могли бы вы дать мне какой-нибудь опыт, объяснение или совет, как поступить. Заранее спасибо.