при обнаружении выбросов с диаграммой рассеяния я должен выбрать ту же функцию для х, у? - PullRequest
0 голосов
/ 15 октября 2019

Я разобрался с числовыми характеристиками (задача кредитного скоринга). Я хочу проверить потенциальные выбросы. Я использую точечные диаграммы, чтобы представить данные проще. числовые характеристики:

  • доход
  • other_income
  • extra_income, sms_confirmation (yes = 1, no = 0)
  • Commission_for_loan
  • количество автомобилей, количество недвижимости, количество детей
  • loan_duration

Я строю каждую функцию против себя.

for feature in basic_data_numerical.columns.values.tolist():
    basic_data_numerical.plot.scatter(x=feature,y=feature)

Мне кажется, это неправильно. Какие особенности я должен построить друг против друга? Или это должно быть только выборочно? Или я должен нарисовать каждую функцию против любой другой функции?

...