Выберите период времени по дню и месяцу - PullRequest
0 голосов
/ 08 марта 2019

У меня есть датафрейм, организованный по годам. Например: date <- seq (as.Date ("2001-07-20"), as.Date ("2010-12-31"), by = 1) <br> Теперь я хочу выбрать подмножество, используя два периода времени: С 23 июня по 13 июля и с 20 июля по 9 августа 2004-2008 гг. Не могли бы вы дать некоторую подсказку? Спасибо!

Да, это можно решить с помощью: test [дата% между% c ("2004-07-20", "2004-08-09")] ... но в моих данных много лет, код может быть очень повторяющимся. Интересно, может ли это быть решено как:

df $ md <- формат (as.Date (df $ date), "% m-% d") df <- df [df $ md% в% c (as.Date (06-23): дата (07-13), дата (07-20): дата (08-09)) и год% в% (2004 : 2008),] </p>

Не работает: ошибка в as.Date.numeric (6 - 23): необходимо указать «origin»

1 Ответ

1 голос
/ 08 марта 2019

Вы можете построить интересующие и подмножества диапазонов:

library(lubridate)    
date <- seq(as.Date("2001-07-20",origin="1970-01-01"),as.Date("2010-12-31",origin="1970-01-01"),by = 1) 

range1 <- as.Date(unlist(lapply(c(0:4),function(y) seq(as.Date("2004-06-23",origin="1970-01-01"),as.Date("2004-07-13",origin="1970-01-01"),by="1 day") + years(y))),origin="1970-01-01")
range2 <- as.Date(unlist(lapply(c(0:4),function(y) seq(as.Date("2004-07-20",origin="1970-01-01"),as.Date("2004-08-09",origin="1970-01-01"),by="1 day") + years(y))),origin="1970-01-01")

date[date %in% range1 | date %in% range2]

Альтернатива

Альтернативный ответ, используя% между%, как предложено в OP

library(lubridate)
dates <- seq(as.Date("2001-07-20"),as.Date("2010-12-31"),by = 1)

r1 <- c(as.Date("2004-06-23"),as.Date("2004-07-13"))
r2 <- c(as.Date("2004-07-20"),as.Date("2004-08-09"))

ranges <- lapply(c(0:4),function(y) list(r1=r1 + years(y),r2=r2+years(y)))
as.Date(unlist(lapply(ranges,function(r) { dates[dates %between% r$r1 | dates %between% r$r2] })))
...