Я довольно новичок в R, поэтому заранее благодарен за вашу помощь.
У меня есть набор данных таблицы Excel, включающий ежедневные цены закрытия финансового актива, начиная с 3 января 2000 года и вплоть до 6 марта.2019. Я хочу использовать модели ARIMA для прогнозирования будущих цен на этот актив, но не могу ввести данные в R.
Проще говоря, у меня есть файл Excel с 2 столбцами и 4736 строками, как показано ниже:
03/jan/00 1,8358
04/jan/00 1,8702
05/jan/00 1,8520
.
.
.
01/mar/19 3,7824
06/mar/19 3,8372
Сразу после чтения файла с помощью команды read_excel(file.choose())
Я пытался использовать команды ts для чтения данных как временных рядов.Однако, учитывая, что данные собираются только во время закрытия рынка в рабочие дни, это не дает желаемых результатов.Также пытался исследовать и читать о сериях типа xts
и zoo
, но, похоже, не смог сделать эти работы.Обратите внимание, что эти данные исключают выходные и праздничные дни, которые, по-видимому, являются корнем проблемы здесь.
my_data <- read_excel(file.choose())
series <- ts(my_data, start=c(2000,1,3), end=c(2019,3,6), frequency = 252)
Используя ts, учитывая, что в среднем 252 рабочих дня в году, мой временной ряд заканчивается на другую датукак следует.
Какие шаги следует рассмотреть, чтобы 1) прочитать данные из файла excel и 2) прочитать импортированные данные в R как временные ряды?
Такжеподумал о том, чтобы вместо использования даты в качестве первого столбца использовать числа от 1 до 4736, чтобы устранить эту необходимость, но кажется, что первый столбец должен иметь формат YYYY-md.
Спасибо за тонну