Question

Я предсказываю модель, используя интерактивные термины:

est = smf.ols(formula='mdvis ~ hlthp * logincome', data=df).fit().

Я получаю довольно хорошие баллы при использовании линейной регрессии около 97% - квадрат R.

Итак, мой вопрос:
При прогнозировании с использованием интерактивных терминов, как оценивать, используя данные теста / обучения, а также вычислять значимость статистики с помощью перекрестной проверки?

manu190466 · Answer 1 · 10 июня 2020

Использование терминов взаимодействия - лишь простой способ построить матрицы экзогов для регрессии. Это не меняет logi c перекрестной проверки.

Разделите фрейм данных на обучающие и тестовые образцы:

train = df.sample(frac=0.8)
test  = df.drop(train.index)

Затем поместите модель в данные поезда:

*

std_train=df.loc[train.index]['delta'].std()
std_test =df.loc[test.index]['delta'].std()

Множественная линейная регрессия с использованием интерактивных терминов в python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Множественная линейная регрессия с использованием интерактивных терминов в python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы