Каков математический принцип установления веса класса в логестической регрессии в scikit-learn? - PullRequest
0 голосов
/ 22 апреля 2019

В алгоритме логической регрессии в библиотеке scikit-learn из python есть аргумент "class_weight". Я хотел бы знать, каков математический принцип реализации установки class_weight во время подбора модели. Связано ли это с изменением целевой функции:

https://drive.google.com/open?id=16TKZFCwkMXRKx_fMnn3d1rvBWwsLbgAU

А какая конкретно модификация?

Заранее спасибо! Я буду признателен за любую помощь от вас!

1 Ответ

0 голосов
/ 22 апреля 2019

Да, это влияет на функцию потерь и очень часто используется, когда ваши метки несбалансированы.Математически функция потерь просто становится средневзвешенной величиной потерь на выборку, где веса зависят от класса данной выборки.Если не используется class_weight, то все выборки взвешиваются равномерно (как на картинке, которую вы прикрепили).

Идея состоит в том, чтобы наказывать за ошибки в прогнозах недопредставленных классов больше, чем за ошибки в перепредставленных классах.

Смотрите более подробное обсуждение здесь .

...