Вычитать дату из предыдущего ряда по группам (используя R) - PullRequest
0 голосов
/ 29 ноября 2018

У меня есть вопрос, похожий на этот ( вычесть значение из предыдущей строки по группе ), но я хочу вычесть предыдущую дату из текущей даты по идентификатору группы, чтобы получитьрасчетное количество дней.Я попытался отредактировать сценарии, предложенные ранее, заменив «значение» на «дату».Хотя я пробовал разные предлагаемые методы, но я продолжаю получать это сообщение об ошибке «Ошибка в mutate_impl (.data, dots): Ошибка оценки: невозможно найти унаследованный метод для функции сначала для сигнатуры« POSIXct »».

Data
id      date        
2380    10/30/12    
2380    10/31/12    
2380    11/1/12     
2380    11/2/12     
20100   10/30/12    
20100   10/31/12   
20100   11/1/12     
20100   11/2/12     
20103   10/30/12

Я бы хотел получить такой стол

Data
id      date        date_difference(in days)
2380    10/30/12    0
2380    10/31/12    1
2380    11/1/12     2
2380    11/2/12     3
20100   10/30/12    0
20100   10/31/12    2
20100   11/1/12     3
20100   11/2/12     4
20103   10/30/12    0
20103   10/31/12    1

Ответы [ 2 ]

0 голосов
/ 29 ноября 2018

Сначала создайте функцию для вычисления разницы в днях

library(stringr)

day_diff <- function(day) {
    days <- difftime(day, "2012-10-30", "days")
    str_extract(days, "\\-*\\d+\\.*\\d*")
}

Затем создайте новый столбец, содержащий разницы в днях

df$date_difference <- unlist(lapply(df$date, day_diff))

Вы можете увидеть предупреждения () об отсутствиичасовые пояса, но вы можете указать (или игнорировать) там.

0 голосов
/ 29 ноября 2018
library(tidyverse)
library(lubridate)
#> 
#> Attaching package: 'lubridate'
#> The following object is masked from 'package:base':
#> 
#>     date

df <- tribble(~id,      ~date,      
2380,    "10/30/12",    
2380,   "10/31/12",    
2380,  "11/1/12",  
2380,    "11/2/12",  
20100,   "10/30/12",    
20100,   "10/31/12",   
20100,   "11/1/12",   
20100,   "11/2/12",   
20103,   "10/30/12",
20103,   "10/31/12")

df %>% 
  mutate(date = mdy(date)) %>% 
  group_by(id) %>% 
  mutate(date_difference = as.numeric(date - first(date)))
#> # A tibble: 10 x 3
#> # Groups:   id [3]
#>       id date       date_difference
#>    <dbl> <date>               <dbl>
#>  1  2380 2012-10-30               0
#>  2  2380 2012-10-31               1
#>  3  2380 2012-11-01               2
#>  4  2380 2012-11-02               3
#>  5 20100 2012-10-30               0
#>  6 20100 2012-10-31               1
#>  7 20100 2012-11-01               2
#>  8 20100 2012-11-02               3
#>  9 20103 2012-10-30               0
#> 10 20103 2012-10-31               1

Создано в 2018-11-29 пакетом представ (v0.2.1)

...