Две двоичные переменные (x и y) образуют два столбца для количества дат в панде Dataframe.Я хочу вычислить показатель корреляции между x и y, который количественно определяет, насколько коррелирован x = 1 с y = 1 (x = 0 с y = 0).
- Какое определение корреляции подходит?
Есть ли встроенная функция?
|день |_x |_ y |
0 | 1 | 1
1 | 1 | 0
2 | 0 | 0
3 | 1 | 1
Объяснение: Это две категории.скажем, у х = были яйца на завтрак (0 или 1), а у = болела голова (0 или 1).И есть данные за несколько дней как для x, так и для y, я пытаюсь понять, насколько сильно коррелируют наличие яиц и головная боль.Я понимаю, что корреляция Пирсона здесь не применима.Что можно было бы использовать?