Вставка NA в промежутки времени - PullRequest
0 голосов
/ 23 июня 2018

У меня есть набор данных временного ряда, который я пытаюсь построить, но у временного ряда есть большие пробелы в данных.При построении этого набора данных R наносит на график эти разрывы с помощью прямой линии, и я бы предпочел, чтобы окончательный график не отображал эти разрывы данных.Единственный способ, которым я знаю, как это исправить, - это вручную вставить одну строку NA между пробелами в наборе данных.Для этого я написал функцию, которая перебирает мой фрейм данных.Функция работает, но работает очень медленно.

#Define Function to Insert NA in long stretches so don't plot line 

PlotSpace<-function(DF){

NROW<-nrow(DF)
for(t in seq(1:NROW)){

TimeDiff<-difftime(DF$TimeStamp[t+1], DF$TimeStamp[t], units = "hours") 
DF[t,"TimeDiff"]<-TimeDiff  

if( !is.na(TimeDiff) & TimeDiff > 5 ){

    NewTimeStamp<-DF$TimeStamp[t] + 1
    NewProfStamp<-DF$ProfStamp[t] + 1
    print(NewTimeStamp)
    DF<-rbind(DF,NA) #Add last row that is NA
    DF[nrow(DF),'TimeStamp']<-NewTimeStamp
    DF[nrow(DF),'ProfStamp']<-NewProfStamp




    }
}

DF <- DF[order(DF$TimeStamp),]
DF<-DF[-1,]
DF$TimeStamp<-as.POSIXct(DF$TimeStamp)

return(DF)

}

Есть ли более эффективный способ сделать это в R?

Пример данных:

 TimeStamp<-c("2015-05-01 10:00:00","2015-05-01 10:05:00","2015-05-01 10:10:00","2015-05-01 10:15:00",
"2015-05-01 10:20:00","2015-05-01 15:00:00","2015-05-01 15:05:00","2015-05-01 15:10:00"
,"2015-05-01 15:20:00","2015-05-01 15:30:00","2015-05-01 15:35:00")

Data<-c(1,2,3,4,5,3,7,8,9,2,11)

DF<-data.frame(TimeStamp, Data)

DF$TimeStamp<-as.POSIXct(DF$TimeStamp)

plot(DF$TimeStamp, DF$Data, type='l')

Как видите, на приведенном выше графике показана линия между 7-часовым разрывом данных.Я хотел бы вставить NA между разницей больше, чем 2 часа.АКА

             TimeStamp Data
1  2015-05-01 10:00:00    1
2  2015-05-01 10:05:00    2
3  2015-05-01 10:10:00    3
4  2015-05-01 10:15:00    4
5  2015-05-01 10:20:00    5
   2015-05-01 10:21:00    NA
6  2015-05-01 15:00:00    3
7  2015-05-01 15:05:00    7
8  2015-05-01 15:10:00    8
9  2015-05-01 15:20:00    9
10 2015-05-01 15:30:00    2
11 2015-05-01 15:35:00   11

1 Ответ

0 голосов
/ 23 июня 2018
library(data.table)
setDT(DF)

# Create indicator for time gap
DF[, gap := c(diff(TimeStamp) > 2*60, F)]
# If there's a gap, add a new row
DF[, if(gap) rbind(.SD, .(TimeStamp = TimeStamp + 60), fill = T)
     else .SD
   , by = 1:nrow(DF)
   ][, -'gap']
#               TimeStamp Data
#  1: 2015-05-01 10:00:00    1
#  2: 2015-05-01 10:05:00    2
#  3: 2015-05-01 10:10:00    3
#  4: 2015-05-01 10:15:00    4
#  5: 2015-05-01 10:20:00    5
#  6: 2015-05-01 10:21:00   NA
#  7: 2015-05-01 15:00:00    3
#  8: 2015-05-01 15:05:00    7
#  9: 2015-05-01 15:10:00    8
# 10: 2015-05-01 15:20:00    9
# 11: 2015-05-01 15:30:00    2
# 12: 2015-05-01 15:35:00   11
...