У меня есть данные о сберегательных счетах физических лиц, и я наблюдаю сумму соглашения, а также даты открытия и закрытия. Вот данные о сбережениях потребителя:
amount <- c(1004, 1004, 1240, 1039, 1240, 1039, 1039, 1240, 1040, 1040)
opening <- as.Date(c('2012-11-19', '2013-05-20', '2014-06-13', '2015-05-26',
'2015-06-13', '2015-11-26', '2016-05-26', '2016-06-13', '2016-11-26',
'2017-05-26'))
closing <- as.Date(c('2013-05-20', '2013-11-20', '2015-06-13', '2015-11-26',
'2016-06-13', '2016-05-26', '2016-11-26', '2017-06-13', '2017-05-26',
'2017-07-10'))
dt <- data.frame(amount, opening, closing)
amount opening closing
1004 2012-11-19 2013-05-20
1004 2013-05-20 2013-11-20
1240 2014-06-13 2015-06-13
1039 2015-05-26 2015-11-26
1240 2015-06-13 2016-06-13
1039 2015-11-26 2016-05-26
1039 2016-05-26 2016-11-26
1240 2016-06-13 2017-06-13
1040 2016-11-26 2017-05-26
1040 2017-05-26 2017-07-10
Моя задача заключается в следующем: я хочу идентифицировать все аккаунты, которые были пролонгированы. Другими словами, я хочу отслеживать все суммы сбережений во времени и видеть, закрыл ли потребитель счет и открыл ли его в тот же день (автоматическое продление сберегательного счета). Например, 2015-05-26 потребитель открыл счет на 1039 $, затем пролонгировал его на 2015-11-26, а затем снова на 2016-05-26, затем на 2016-11-26 (1040 $) и наконец-то 2017-05-26 (1040 $).
Я могу идентифицировать эти учетные записи с ifelse(dt$opening %in% dt$closing, 1, 0)
, но этого явно недостаточно. Я не уверен, как действовать и какова обычная методология в таких случаях (интересно, было бы хорошим началом репликации всего набора данных).
Конечная цель - выяснить, внес ли кто-то сумму сбережений или уменьшил ее при пролонгации счета.
Надеюсь, это достаточно ясно. Любая помощь очень ценится!