Какой уровень значимости учитывается в регрессии Logisti c с использованием Scikit-Learn? - PullRequest
0 голосов
/ 25 января 2020

Когда мы запускаем регрессию logisti c в Scikit-Learn, мы не видим p-значение (хотя есть некоторые способы получить это значение). Что я хочу знать, так это то, как p-значение работает в этой регрессии с использованием этой библиотеки. Рассматриваются ли все переменные, даже если значение p превышает некоторый порог? Если нет, то каков порог?

Например, предположим, у нас есть две переменные, x1 и x2. Мы запускаем следующую регрессию logisti c:

clf = LogisticRegression().fit(df[['x1','x2']], df['y'])

После выполнения этой регрессии мы получаем коэффициенты:

clf.coef_

Если значение p для x1 равно 0,8, будет x1 Коэффициент появится в выводе? Если нет, то какой порог рассматривается библиотекой: 0,01, 0,5 или 0,1?

1 Ответ

0 голосов
/ 25 января 2020

scikit-learn's LogisticRegression не имеет функциональности по умолчанию, просто он не реализован, p-значения не вычисляются и не выводятся. p-значения, как правило, не используются в машинном обучении, это скорее представление статистики (частых).

На этом сайте есть и другие вопросы, которые отвечают на вопрос о том, как вычислить p-значения, например this один, и это добавляет к доказательству, что scikit-learn не делает этого в текущих версиях.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...