выбор запаздывающих предикторов с TSLM с использованием AICc - PullRequest
0 голосов
/ 29 января 2020

Я пытаюсь определить запаздывающие предикторы для включения в мою модель временных рядов. Поэтому я установил TSLM с задержкой до 3 независимой переменной

lag_models <- data_train %>% model(
    ts_lag_0 = TSLM(Y ~ X)
  , ts_lag_1 = TSLM(Y ~ X + lag_X_01)
  , ts_lag_2 = TSLM(Y ~ X + lag_X_01 + lag_X_02)
  , ts_lag_3 = TSLM(Y ~ X + lag_X_01 + lag_X_02 + lag_X_03)
 )

data_train содержит данные перекрестной проверки.

lag_models %>% glance()

Запустив код выше, я получаю AI C, AI Cc, BI C и др. c. по модели с запаздывающим предиктором по .id. Мне интересно, можно ли вытащить эти метрики по модели только по модели, не используя group_by () и sumrize ().

Большое спасибо.

1 Ответ

0 голосов
/ 29 января 2020

При использовании перекрестной проверки вы оцениваете модель для каждого сгиба / среза данных. В результате вы получите набор сводных статистических данных (AI C, AI Cc, BI C и др. c.) Для каждой оценочной модели. Если бы вы объединили их с помощью group_by () и sumrize (), вы бы объединили сводную информацию из моделей с разными данными ответов - это не рекомендуется, поскольку критерий информации несопоставим, когда данные ответов различаются.

Если вы хотите сравнить производительность каждой из моделей с помощью перекрестной проверки, вы можете использовать показатели точности вне выборки, используя точность (). Примеры использования басни для перекрестной проверки точности можно найти по адресу https://otexts.com/fpp3/tscv.html

...