подсчитать количество дел по дате отсечения - PullRequest
1 голос
/ 23 сентября 2019

Привет, я борюсь с тем, как подсчитать количество случаев с учетом даты отсечения.В Таблице AI есть идентификаторы с датами отсечения, прикрепленными к каждому идентификатору.В Таблице BI есть идентификаторы с датами, когда произошел иск.Я надеюсь подсчитать количество случаев, через которые прошел ИД, к дате отсечения в Таблице А.

Таблица А

ID     Date       
A    2019-01-03      
A    2019-05-03      
A    2019-09-23      
B    2019-02-04      
B    2019-03-16      

Таблица Б

ID   Claim_Date   
 A    2018-12-03      
 A    2019-04-23      
 B    2019-03-16   

Я хочу добиться ниже структуры данных:

ID     Date           Claims

A       2019-01-03         1  
A       2019-05-03         2   
A       2019-09-23         2   
B       2019-02-04         0   
B       2019-03-16         1   

Я пробовал несколько способов, но ничего не получалось.Может ли кто-нибудь помочь мне в этом?Заранее большое спасибо за помощь!

1 Ответ

1 голос
/ 23 сентября 2019

Вы можете попробовать следующее с dply, tidyr и lubridate

library(dplyr)
library(tidyr)
library(lubridate)

# Transform to date columns
TableA <- TableA %>%
    mutate(Date = lubridate::date(Date))

TableB <- TableB %>%
    mutate(Claim_Date = lubridate::date(Claim_Date))

# Join Tables and count Dates greater or equal than Claim Dates.
TableA %>%
 left_join(TableB) %>%
 mutate(Claims = ifelse(Date >= Claim_Date,1,0)) %>%
 group_by(ID, Date) %>%
 summarise(Claims = sum(Claims))


Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...