Задача: Построить прогноз с линейным или квадратичным детерминированным трендом для будущего числа сотрудников в США. Розничная торговля.
Ссылка на данные: https://fred.stlouisfed.org/series/USTRADE?fbclid=IwAR0-YU8nyc8iQCLOjd9DxRsU8G_GNEWEow_g2a6ob1cP0bu_xQSXO1FFPi8
После загрузки данных.Я использую этот код для загрузки.
Employees_data <- read.csv(file.choose(), header=TRUE, sep = ",")
Затем я понимаю, что мой столбец даты отформатирован как «фактор», поэтому я использую этот код:
Employees_data$DATE <- as.Date(Employees_data$DATE,"%Y-%m-%d")
Затем я пытаюсь сделатьlm (), но понимаю, что мне нужно 2 числовых значения.
LinearModel <- lm(Employees_data$USTRADE~Employees_data$DATE)
Поэтому я теперь конвертирую дату в числовое значение, используя:
Employees_data$DATE <- as.numeric(Employees_data$DATE)
Но что я знаю, теперь я получаю отрицательныйчисловые значения для моего столбца даты.
data.frame': 968 obs. of 2 variables:
$ DATE : num -11323 -11292 -11264 -11233 -11203 ...
$ USTRADE: num 3108 3122 3140 3155 3152 ...
Когда я преобразовал столбец даты в число в Excel, я получаю следующие значения:
Date Employees
14.246 31.071
14.277 31.211
...
Где числа в столбце Дата указывают количество дней.Имея это, я могу сделать регрессию в Excel, используя Employees в качестве Y и Date в качестве X
Получая прекрасный результат:
Coefficients
Intercept -48685,09628
Date 5,079443779
Как я могу сделать это в R?Я пытаюсь выучить R.
любая помощь приветствуется:)