ANOVA для высоких кардинальных характеристик - PullRequest
1 голос
/ 13 февраля 2020

У меня есть несколько основных кардинальных и низких кардинальных характеристик. Целевая особенность числовая. Я могу знать корреляцию между низкими кардинальными характеристиками и целевой переменной с кодом ниже

F, p = stats.f_oneway(df[df.some_variable=='value_1'].Target,df[df.some_variable=='value_2'].Target)
print(F)

Здесь вышеупомянутая особенность является низкой кардинальной и имеет только два различных значения. Как найти корреляцию, если функция имеет большую мощность, например, 400 различных значений. любые предложения и альтернативные идеи приветствуются. Спасибо за ваше терпение

1 Ответ

0 голосов
/ 13 февраля 2020

при условии vals это список значений

df_arr = [df[df.some_variable==val].Target for val in vals]
F, p = stats.f_oneway(*df_arr)
...