Множественная линейная регрессия с использованием интерактивных терминов в python - PullRequest
0 голосов
/ 08 мая 2020

Я предсказываю модель, используя интерактивные термины:

est = smf.ols(formula='mdvis ~ hlthp * logincome', data=df).fit(). 

Я получаю довольно хорошие баллы при использовании линейной регрессии около 97% - квадрат R.

Итак, мой вопрос:
При прогнозировании с использованием интерактивных терминов, как оценивать, используя данные теста / обучения, а также вычислять значимость статистики с помощью перекрестной проверки?

1 Ответ

0 голосов
/ 10 июня 2020

Использование терминов взаимодействия - лишь простой способ построить матрицы экзогов для регрессии. Это не меняет logi c перекрестной проверки.

Разделите фрейм данных на обучающие и тестовые образцы:

train = df.sample(frac=0.8)
test  = df.drop(train.index)

Затем поместите модель в данные поезда:

*
std_train=df.loc[train.index]['delta'].std()
std_test =df.loc[test.index]['delta'].std()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...