Я работаю над регрессионным анализом с индикаторными переменными для временного ряда с сезонными колебаниями. Набор данных довольно прост, только с переменными «год-квартал» (временной ряд 27 кварталов), «t» и «y» (количество рабочих часов в тысячах).
## 'data.frame': 28 obs. of 6 variables:
## $ year-quarter: Factor w/ 28 levels "1989-q1","1989-q2",..: 1 2 3 4 5 6 7 8 9 10 ...
## $ t : num 1 2 3 4 5 6 7 8 9 10 ...
## $ y : num 106 129 133 132 108 134 133 119 112 128 ...
## $ Ind1 : Factor w/ 2 levels "0","1": 2 1 1 1 2 1 1 1 2 1 ...
## $ Ind2 : Factor w/ 2 levels "0","1": 1 2 1 1 1 2 1 1 1 2 ...
## $ Ind3 : Factor w/ 2 levels "0","1": 1 1 2 1 1 1 2 1 1 1 ...
Теперь мне нужно создать регрессионную модель, чтобы найти уравнения для каждой четверти (Q1 - Q4), выраженные как ŷ = (Квартальный перехват) + t (общий наклон), а также уравнение для линия тренда ŷT. Затем я делаю прогноз y для каждого квартала года, следующего за временным рядом в наборе данных. Предполагается, что анализ будет проводиться с использованием «индикаторных переменных» или «фиктивных переменных». Это «Ind1», «Ind2» и «Ind3» для 1, 2 и 3 квартала соответственно. Вывод линейной модели с переменными индикатора выглядит следующим образом:
summary(lm(Table1$y ~ Table1$t + Ind1 + Ind2 + Ind3))
##
## Call:
## lm(formula = Table1$y ~ Table1$t + Ind1 + Ind2 + Ind3)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.8036 -2.9509 -0.4018 2.5179 11.4821
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 125.3571 2.7391 45.766 < 2e-16 ***
## Table1$t -1.2098 0.1211 -9.994 7.73e-10 ***
## Ind1 -8.3437 2.7631 -3.020 0.00610 **
## Ind2 8.1518 2.7498 2.965 0.00694 **
## Ind3 14.2188 2.7418 5.186 2.94e-05 ***
Я пытался применить методы из этого урока (https://otexts.com/fpp2/useful-predictors.html), но не сделал удалось в полной мере использовать их. У меня вопрос: будет ли эта модель пригодна для этой цели или есть лучший способ добиться результатов?