Удаление цели из набора данных
labels = np.array(master_data['Promoted_or_Not'])
labels_1 = labels.tolist()
Удаление атрибутов id
df_data = master_data.drop(['Promoted_or_Not','EmployeeNo'],axis=1)
print("Shape of Data:",df_data.shape)
df = df_data.values
xgb_model = xgb.XGBClassifier()
print(xgb_model)
Перекрестные оценки
f1_scores = cross_val_score(xgb_model, df, labels_1, cv=5, scoring='f1')
print(f1_scores," Mean = ",np.mean(f1_scores))
Обучение моделей
xgb_model.fit(df,labels_1)