Какие особенности выбрать при построении диаграммы рассеяния для определения границы решения в бинарной модели классификации? - PullRequest
0 голосов
/ 11 марта 2020

Я работаю над набором данных defaults.csv (кредитные карты UCI) с несколькими функциями с целевым столбцом (меткой) для бинарной модели классификации. Я хочу показать диаграмму рассеяния с границей решения. График должен выглядеть примерно так: Binary classification

В настоящее время я использую следующий код со случайными функциями:

df['BILL_AMT4'] = df['BILL_AMT4'].astype(float)
df['LIMIT_BAL'] = df['LIMIT_BAL'].astype(float)
sns.lmplot('LIMIT_BAL', 'BILL_AMT4', df, hue='default payment next month', fit_reg=False)
fig = plt.gcf()
fig.set_size_inches(15, 10)
plt.show()

У меня возникли проблемы с какими функциями выбрать из набора элементов для осей X и Y, чтобы выбрать модель. Например - линейное разделение-Logisti c регрессия, нелинейная - svm et c.

Как мне достичь этого графика?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...