Прежде всего, спасибо, что нашли время, чтобы посмотреть на мой вопрос.
Я столкнулся со следующей проблемой:
У меня есть некоторые данные, сгруппированные по кварталам (выглядит примерно так:)
Cust_ID Date QTR Price Action Link_Cust_ID
1 1/1/18 2018 Q1 23 NA NA
1 1/2/18 2018 Q1 22.2 NA NA
1 1/3/18 2018 Q1 12.1 2 5
1 1/4/18 2018 Q1 14.1 5 NA
3 1/1/18 2018 Q1 101 NA NA
3 1/2/18 2018 Q1 55 2 18
... ... ... ... ... ...
(у меня есть данные за много кварталов и много Cust_ID)
По сути, я пытаюсь сделать это для каждой ценной бумаги в каждом квартале, если Action = 2, я хочу включить данные Link_Cust_ID (которые, мы можем сказать, хранятся в другом файле df с именем «Клиенты») для оставшейся части квартала.
Я не могу понять, как получить данные для Link_Cust_ID ТОЛЬКО ДО конца квартала. Надеемся, что ищем решение с использованием dplyr, но на данный момент готовы принять любое решение / помощь.
В идеале приведенная выше таблица будет выглядеть так:
Cust_ID Date QTR Price Action Link_Cust_ID
1 1/1/18 2018 Q1 23 NA NA
1 1/2/18 2018 Q1 22.2 NA NA
1 1/3/18 2018 Q1 12.1 2 5
5 1/3/18 2018 Q1 10.1 NA NA
1 1/4/18 2018 Q1 14.1 5 NA
5 1/4/18 2018 Q1 11.1 NA NA
3 1/1/18 2018 Q1 101 NA NA
3 1/2/18 2018 Q1 55 2 18
18 1/2/18 2018 Q1 56 NA NA
... ... ... ... ... ...
Большое спасибо. Пожалуйста, дайте мне знать, если вы хотите, чтобы я кое-что прояснил или у вас были предложения по улучшению моего вопроса! # Keeplearning
Ниже приведен пример таблицы клиентов, которая содержит данные для всех клиентов.
Cust_ID Date QTR Price Action Link_Cust_ID
1 1/1/18 2018 Q1 23 NA NA
...
1 11/7/18 2018 Q4 66 NA NA
2 1/1/18 2018 Q1 3.2 NA NA
...
2 11/7/18 2018 Q4 1.3 NA NA
...
5 1/1/18 2018 Q1 9.5 NA NA
5 1/3/18 2018 Q1 10.1 NA NA
....
По существу - таблица Customer содержит все данные о клиентах.
Рассматриваемая таблица (куда я хочу получить данные, когда действие = 2) является подмножеством таблицы Customer с некоторым ограничением