Как использовать «Перекрестная проверка» для данных ниже?
Набор данных содержит следующие переменные:
- NetValue (числовой, например, 1000)
- DW_EK_Store (Числовой, но используется как Категориальный, следовательно, 'C (DW_EK_Store)')
- DW_EK_Product (Числовой, но используется как Категориальный, следовательно, 'C (DW_EK_Product)')
- DW_EK_Date_Sellout_Daily (формат даты, но используется как категориальный, поэтому 'C (DW_EK_Date_Sellout_Daily)')
КОД:
import pandas as pd
import statsmodels.formula.api as smf
data = pd.read_csv("/Users/USER/Desktop/500.csv", sep=';')
lm=smf.ols(formula="NetValue ~ C(DW_EK_Store) + C(DW_EK_Product) + C(DW_EK_Date_Sellout_Daily)",data=data).fit()
lm.summary()
// Btw. Я использую JupyterLab 0.32.1 и Python