Я использую XGBoost для своей задачи классификации с разделением проверки поезда следующим образом:
D_tr = xgboost.DMatrix(self.x_tr, label = self.y_tr)
D_val = xgboost.DMatrix(self.x_val, label = self.y_val)
self.clf = xgboost.train(hyperparameters, D_tr, rounds)
self.pred_tr = self.clf.predict(D_tr)
self.pred_val = self.clf.predict(D_val)
Когда я писал эту часть кода, у меня было какое-то впечатление, что код работает неправильно параметр метки в D_val. Но я только что узнал, что мне не нужно ничего вставлять!
Мой вопрос таков: влияет ли введение истинных меток в декларацию DMatrix на точность прогноза?
Хотя теперь я просто мне больше не нужно использовать проверочные метки в коде, я задаю этот вопрос, потому что мне интересно, может ли это сделать мои предыдущие результаты совершенно недействительными.