Question

В алгоритме логической регрессии в библиотеке scikit-learn из python есть аргумент "class_weight". Я хотел бы знать, каков математический принцип реализации установки class_weight во время подбора модели. Связано ли это с изменением целевой функции:

https://drive.google.com/open?id=16TKZFCwkMXRKx_fMnn3d1rvBWwsLbgAU

А какая конкретно модификация?

Заранее спасибо! Я буду признателен за любую помощь от вас!

Jan K · Answer 1 · 22 апреля 2019

Да, это влияет на функцию потерь и очень часто используется, когда ваши метки несбалансированы.Математически функция потерь просто становится средневзвешенной величиной потерь на выборку, где веса зависят от класса данной выборки.Если не используется class_weight, то все выборки взвешиваются равномерно (как на картинке, которую вы прикрепили).

Идея состоит в том, чтобы наказывать за ошибки в прогнозах недопредставленных классов больше, чем за ошибки в перепредставленных классах.

Смотрите более подробное обсуждение здесь .

Каков математический принцип установления веса класса в логестической регрессии в scikit-learn?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Каков математический принцип установления веса класса в логестической регрессии в scikit-learn?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы