Расчет максимальной продолжительности превышения порога в R (временных рядов) - PullRequest
0 голосов
/ 11 февраля 2019

У меня есть данные температуры xts-timeseries в разрешении 5 минут.

head(dataset)
Time                Temp
2016-04-26 10:00:00 6.877
2016-04-26 10:05:00 6.877
2016-04-26 10:10:00 6.978
2016-04-26 10:15:00 6.978
2016-04-26 10:20:00 6.978
  1. Я хочу рассчитать самую длительную температуру, превышающую определенный порог.(скажем, 20 ° C)
  2. Я хочу рассчитать все периоды с продолжительностью, при которой температура превышает определенный порог.
  3. Я создаю data.frame из моих xts-данных:

    df=data.frame(Time=index(dataset),coredata(dataset))
    head(df)
    Time                  Temp
    1 2016-04-26 10:00:00 6.877
    2 2016-04-26 10:05:00 6.877
    3 2016-04-26 10:10:00 6.978
    4 2016-04-26 10:15:00 6.978
    5 2016-04-26 10:20:00 6.978
    6 2016-04-26 10:25:00 7.079
    
  4. , затем я создаю подмножество только с данными, которые превышают порог:

    sub=(subset(x=df,subset = df$Temp>20))
    head(sub)
                Time         Temp
    7514 2016-05-22 12:05:00 20.043
    7515 2016-05-22 12:10:00 20.234
    7516 2016-05-22 12:15:00 20.329
    7517 2016-05-22 12:20:00 20.424
    7518 2016-05-22 12:25:00 20.615
    7519 2016-05-22 12:30:00 20.805
    

    Но теперь у меня возникли проблемы с вычислением продолжительностиЕсли температура превышает пороговое значение.Я не знаю, как определить связанный период и рассчитать их продолжительность?

Я был бы рад, если у вас есть решение для этого вопроса (это моя первая тема, поэтому прошу прощения за незначительные ошибки) Если вам нужна дополнительная информация о моих данных, не стесняйтесь спрашивать.

1 Ответ

0 голосов
/ 11 февраля 2019

Это может сработать.Я беру в качестве примера следующие данные:

df <- structure(list(Time = structure(c(1463911500, 1463911800, 1463912100, 
1463912400, 1463912700, 1463913000), class = c("POSIXct", "POSIXt"
), tzone = ""), Temp = c(20.043, 20.234, 6.329, 20.424, 20.615, 
20.805)), row.names = c(NA, -6L), class = "data.frame")

> df
                 Time   Temp
1 2016-05-22 12:05:00 20.043
2 2016-05-22 12:10:00 20.234
3 2016-05-22 12:15:00  6.329
4 2016-05-22 12:20:00 20.424
5 2016-05-22 12:25:00 20.615
6 2016-05-22 12:30:00 20.805

library(dplyr)
df %>% 
  # add id for different periods/events
  mutate(tmp_Temp = Temp > 20, id = rleid(tmp_Temp)) %>% 
  # keep only periods with high temperature
  filter(tmp_Temp) %>%
  # for each period/event, get its duration
  group_by(id) %>%
  summarise(event_duration = difftime(last(Time), first(Time)))


     id event_duration
  <int> <time>        
1     1  5 mins       
2     3 10 mins       
...