Соотношение между логическим и продолженным значением - PullRequest
0 голосов
/ 02 мая 2019

Мне было интересно, есть ли у меня пандас с 3 колонками.Первый из них является логическим, а остальные являются плавающими.

Если я запускаю .corr () на моем фрейме данных, как следует интерпретировать ответ?Например:

corr_matrix = df.corr()
corr_matrix["Bought"].abs().sort_values(ascending=False)

Bought         1.000000
Price          0.283186
Price2         0.118623

Можно ли сказать, что «Цена» больше коррелирует с флагом «Куплено» и будет влиять на модель больше, чем «Цена2»?

Как я мог бы иначе решитькакую цену использовать в моей модели?

1 Ответ

1 голос
/ 02 мая 2019

Вы должны искать точечно-двойственную корреляцию (, которая является частным случаем корреляции Пирсона ).Если вам действительно нужно использовать панд без какой-либо другой библиотеки, то я думаю, что корреляция Пирсона должна работать, просто кодируя ваше true / false как 1 и 0.

...