У меня есть набор данных с 53 независимыми переменными (X) и 1 зависимой (Y).
Зависимой переменной является логическое значение (либо 1, либо 0), в то время как независимый набор состоит как из непрерывного, так и издискретные переменные.
Я планировал использовать pandas.DataFrame.corr () для вывода списка наиболее влиятельных переменных для вывода Y.
corr может быть:
- регрессия Пирсона
- регрессия Кендалла
- регрессия Спирмена
Я получаю разные результаты для 3 подходов.
У вас есть предложения, какой из них будет наиболееподходит ли данная форма (дискретный + непрерывный) набора данных?