Я работаю над набором данных defaults.csv (кредитные карты UCI) с несколькими функциями с целевым столбцом (меткой) для бинарной модели классификации. Я хочу показать диаграмму рассеяния с границей решения. График должен выглядеть примерно так:
В настоящее время я использую следующий код со случайными функциями:
df['BILL_AMT4'] = df['BILL_AMT4'].astype(float)
df['LIMIT_BAL'] = df['LIMIT_BAL'].astype(float)
sns.lmplot('LIMIT_BAL', 'BILL_AMT4', df, hue='default payment next month', fit_reg=False)
fig = plt.gcf()
fig.set_size_inches(15, 10)
plt.show()
У меня возникли проблемы с какими функциями выбрать из набора элементов для осей X и Y, чтобы выбрать модель. Например - линейное разделение-Logisti c регрессия, нелинейная - svm et c.
Как мне достичь этого графика?