Я разобрался с числовыми характеристиками (задача кредитного скоринга). Я хочу проверить потенциальные выбросы. Я использую точечные диаграммы, чтобы представить данные проще. числовые характеристики:
- доход
- other_income
- extra_income, sms_confirmation (yes = 1, no = 0)
- Commission_for_loan
- количество автомобилей, количество недвижимости, количество детей
- loan_duration
Я строю каждую функцию против себя.
for feature in basic_data_numerical.columns.values.tolist():
basic_data_numerical.plot.scatter(x=feature,y=feature)
Мне кажется, это неправильно. Какие особенности я должен построить друг против друга? Или это должно быть только выборочно? Или я должен нарисовать каждую функцию против любой другой функции?