При использовании параметра scale_pos_weight в xgboost я не знаю, почему это происходит? - PullRequest
1 голос
/ 08 мая 2019

Я должен решить проблему двоичной классификации. (Соотношение размера данных поезда между меткой 0 и 1 составляет 4,7: 1) Итак, я создал модель с помощью алгоритма xgboost. Результат неплохой.
- AUC: 0,989
- Точность (0/1): 0,998 / 0,938
- Напомним (0/1): 0,992 / 0,986
- F Score (0/1): 0,995 / 0,962
Но я хочу повысить точность метки 1 (0,938). Итак, я попытался настроить параметры в xgboost. В частности, мне любопытно настроить параметр Scale_pos_weight. Во-первых, я применил это значение, как рекомендовано в документации по xgboost. (число (отрицательное) / число (положительное) = 4,7)
scale_pos_weight=4.7
- AUC: 0,973
- Точность (0/1): 0,999 / 0,807
- Напомним (0/1): 0,971 / 0,994
- F Score (0/1): 0,985 / 0,891
Точность метки 1 снизилась, а Recall увеличилась. Наоборот, я применил обратную величину 4,7
- AUC: 0,988
- Точность (0/1): 0,992 / 0,956
- Напомним (0/1): 0,995 / 0,937
- F Score (0/1): 0,993 / 0,946
Результат - то, что я хотел. Я не знаю, почему появились эти результаты ... Пожалуйста, объясните, что происходит ..

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...