У меня есть модель в XGBoost, которая построена на наборе данных из 100 тысяч сэмплов и 70 функций. Цель = «бинарный: логистический».
Я хочу визуализировать результаты примерно так, как на картинке в приложении: 1) данные разбросаны по 2D графику, 2) логистическая линия, которая разбивает данные по категориям 1 или 0, 3) и порог - модельЧувствительность. картина логистической регрессии
# create and train model
bst = xgb.train(param,
dtrain,
num_boost_round = best_iteration)
# model parameters
num_parallel_tree = 1 # default value
subsample = 1 # default value
colsample_bytree = 0.4
objective = 'binary:logistic'
learning_rate = 0.05
eval_metric = 'auc'
max_depth = 10
min_child_weight = 4
n_estimators = 5000
seed = 7
В будущем будет здорово найти параметр логической регрессии, который регулирует чувствительность модели - то есть перемещает порог вверх и вниз (на некоторое время ярегулировать чувствительность модели, увеличивая colsample_by_tree, max_depth, num_trees, subsample, но мне кажется, что это неправильно).