Выбор функции ANOVA в python - PullRequest
1 голос
/ 30 апреля 2020
data=pd.read_csv("https://raw.githubusercontent.com/sharmaroshan/Online-Shoppers-Purchasing- Intention/master/online_shoppers_intention.csv")

Я пытаюсь выполнить выбор объектов на основе ANOVA (Категориальная или числовая переменная).

зависимая переменная: независимая от дохода переменная: административная, административная_длительность

import statsmodels.api as sm
from   statsmodels.formula.api import ols
from   statsmodels.stats.anova import anova_lm
model = ols('Revenue ~ Informational',data = data).fit()
anova_table=anova_lm(model)

но появляется следующая ошибка,

ошибка значения (ошибка формы)

1 Ответ

3 голосов
/ 30 апреля 2020

Проблема связана со столбцом Revenue в данных, поскольку он является логическим. На самом деле, если вы преобразуете из логического в целое число, то это работает:

data.Revenue = data.Revenue.astype(int)
...