Я предсказываю модель, используя интерактивные термины:
est = smf.ols(formula='mdvis ~ hlthp * logincome', data=df).fit().
Я получаю довольно хорошие баллы при использовании линейной регрессии около 97% - квадрат R.
Итак, мой вопрос:
При прогнозировании с использованием интерактивных терминов, как оценивать, используя данные теста / обучения, а также вычислять значимость статистики с помощью перекрестной проверки?