В логистической регрессии, как мне установить «контрольный уровень» для моих фиктивных переменных в Python - PullRequest
0 голосов
/ 06 ноября 2019

Я делаю модель логистической регрессии в python, используя statsmodel. Так как многие из моих столбцов являются категориальными, я однозначно закодировал их, используя get_dummies. Мой новый фрейм данных теперь имеет намного больше столбцов с 1 и 0. (например, пол1, пол2, статистика1, статус2, статус 3 и т. д.).

с этим новым фреймом данных, как мне установить «контрольный уровень» для моей логистической регрессии? по умолчанию, как мне узнать, какой у меня контрольный уровень?

1 Ответ

0 голосов
/ 06 ноября 2019

Я не на 100% о чем ваш вопрос, но в scikit-learn существует концепция фиктивного регрессора .

Если у вас есть датафрейм df, он работает следующим образом:

from sklearn.dummy import DummyRegressor
clf = DummyRegressor(strategy='mean', random_state=0)
clf = clf.fit(X, y)

Существует также классификатор DummyClassifier с import DummyClassifier. Проверьте документы, идея всегда состоит в том, чтобы предсказать базовый уровень средней или наиболее частой категории.

...