Временные ряды на небольшом наборе данных.Также не происходит применение АПД - PullRequest
0 голосов
/ 26 июня 2019

Привет, я новичок в R и пытался преобразовать фрейм данных в объект временного ряда, но после применения groupby к определенному индексу тип данных изменяется на формат "tbl_df", "tbl", "data.frame". Также я пытаюсь сделать другое подмножество данных из существующего, которое возвращает ноль. Также после преобразования кадра данных в объект временного ряда его преобразование в матрицу ts. Пожалуйста, дайте мне знать, почему все это происходит?

Я перепробовал все основные операции, но почему-то не хватает фоновой интерпретации всех кодов, используемых в коде. Пожалуйста, помогите

data <- read.csv("Time_Series_Data_Peak2.csv")
head(data)
class(data)
#Groupby
library(dplyr)
Dates_class = data %>% 
  group_by(Date) %>% 
  summarise(Dates_class= sum(Calls_Handled))
View(Dates_class)
head(Dates_class)
plot(Dates_class$Date,Dates_class$Dates_class)
lines(Dates_class$Date,Dates_class$Dates_class)
class(Dates_class)
Dates_class1 <- ts(Dates_class,start=c(2019,3),end=c(2019,5),frequency=1)

Я хочу, чтобы данные были готовы для проверки стационарности.

Edit:

Пример данных из комментария:

structure(list(Date = c("20/01/0003", "20/01/0003", "20/01/0003", "20/01/0003", "20/01/0003", "20/01/0003"), Date2 = structure(c(17956, 17956, 17956, 17956, 17956, 17956), class = "Date"), Calls_Handled = c(30L, 43L, 36L, 28L, 32L, 23L)), row.names = c(NA, 6L), class = "data.frame") 

1 Ответ

0 голосов
/ 27 июня 2019

Поскольку существует явная проблема со столбцом «Дата», вместо этого я использую «Дата2».После подведения итогов вы получили data.frame, но для проведения теста вам нужны временные ряды.В коде я также изменил имя сводной переменной на CallsH, сделав его понятным.

Dates_class = data %>% 
  group_by(Date2) %>% 
  summarise(CallsH= sum(Calls_Handled))
#View(Dates_class)
head(Dates_class)
plot(Dates_class$Date2,Dates_class$CallsH,type="l",col=3)
class(Dates_class)
dfts=timeSeries::as.timeSeries(Dates_class$CallsH,Dates_class$Date2)
tseries::adf.test(dfts, k = 10)

Редактировать: (полное моделирование)

data=structure(list(Date = c("20/01/0003", "20/01/0003", "20/01/0003", "20/01/0003", "20/01/0003", "20/01/0003"), Date2 = structure(c(17956, 17956, 17956, 17956, 17956, 17956), class = "Date"), Calls_Handled = c(30L, 43L, 36L, 28L, 32L, 23L)), row.names = c(NA, 6L), class = "data.frame") 
dts=seq.Date(from=as.Date("2019/03/02"),to=as.Date("2019/05/31"),by = "day")
ls=length(dts)
ch=runif(6*ls,15,34)
data=rbind(data,data.frame(Date=dts,Date2=dts,Calls_Handled=ch))
#data <- read.csv("Time_Series_Data_Peak2.csv")
head(data)
class(data)
#Groupby
library(dplyr)
Dates_class = data %>% 
  group_by(Date2) %>% 
  summarise(CallsH= sum(Calls_Handled))
#View(Dates_class)
str(Dates_class)
summary(Dates_class)
plot(Dates_class$Date2,Dates_class$CallsH,type="l",col=3)
#lines(Dates_class$Date2,Dates_class$Dates_class)
class(Dates_class)
dfts=timeSeries::as.timeSeries(Dates_class$CallsH,Dates_class$Date2)
tseries::adf.test(dfts, k = 10)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...