Lars Emil Lorry Feilberg 21 апреля 2019 101

Есть ли в Python простая функция для включения перекрестной проверки?

Lars Emil Lorry Feilberg / 21 апреля 2019

Как использовать «Перекрестная проверка» для данных ниже? Набор данных содержит следующие переменные:

NetValue (числовой, например, 1000)
DW_EK_Store (Числовой, но используется как Категориальный, следовательно, 'C (DW_EK_Store)')
DW_EK_Product (Числовой, но используется как Категориальный, следовательно, 'C (DW_EK_Product)')
DW_EK_Date_Sellout_Daily (формат даты, но используется как категориальный, поэтому 'C (DW_EK_Date_Sellout_Daily)')

КОД:

import pandas as pd
import statsmodels.formula.api as smf

data = pd.read_csv("/Users/USER/Desktop/500.csv", sep=';')

lm=smf.ols(formula="NetValue ~ C(DW_EK_Store) + C(DW_EK_Product) + C(DW_EK_Date_Sellout_Daily)",data=data).fit()

lm.summary()

// Btw. Я использую JupyterLab 0.32.1 и Python

...