Добавление данных к текущему DF путем извлечения данных из другого DF, если выполняется условие - PullRequest
0 голосов
/ 07 ноября 2018

Прежде всего, спасибо, что нашли время, чтобы посмотреть на мой вопрос.

Я столкнулся со следующей проблемой:

У меня есть некоторые данные, сгруппированные по кварталам (выглядит примерно так:)

Cust_ID   Date    QTR    Price    Action   Link_Cust_ID
  1      1/1/18  2018 Q1   23       NA       NA
  1      1/2/18  2018 Q1   22.2     NA       NA
  1      1/3/18  2018 Q1   12.1     2        5
  1      1/4/18  2018 Q1   14.1     5        NA
  3      1/1/18  2018 Q1   101      NA       NA
  3      1/2/18  2018 Q1   55       2        18
 ...      ...      ...     ...     ...      ...

(у меня есть данные за много кварталов и много Cust_ID)

По сути, я пытаюсь сделать это для каждой ценной бумаги в каждом квартале, если Action = 2, я хочу включить данные Link_Cust_ID (которые, мы можем сказать, хранятся в другом файле df с именем «Клиенты») для оставшейся части квартала.

Я не могу понять, как получить данные для Link_Cust_ID ТОЛЬКО ДО конца квартала. Надеемся, что ищем решение с использованием dplyr, но на данный момент готовы принять любое решение / помощь.

В идеале приведенная выше таблица будет выглядеть так:

Cust_ID   Date    QTR    Price    Action   Link_Cust_ID
  1      1/1/18  2018 Q1   23       NA       NA
  1      1/2/18  2018 Q1   22.2     NA       NA
  1      1/3/18  2018 Q1   12.1     2        5
  5      1/3/18  2018 Q1   10.1     NA       NA
  1      1/4/18  2018 Q1   14.1     5        NA
  5      1/4/18  2018 Q1   11.1     NA       NA
  3      1/1/18  2018 Q1   101      NA       NA
  3      1/2/18  2018 Q1   55       2        18
  18     1/2/18  2018 Q1   56       NA       NA
 ...      ...      ...     ...     ...      ...

Большое спасибо. Пожалуйста, дайте мне знать, если вы хотите, чтобы я кое-что прояснил или у вас были предложения по улучшению моего вопроса! # Keeplearning


Ниже приведен пример таблицы клиентов, которая содержит данные для всех клиентов.

Cust_ID   Date     QTR     Price   Action   Link_Cust_ID
  1      1/1/18  2018 Q1    23      NA         NA
 ...
  1     11/7/18  2018 Q4    66      NA         NA
  2      1/1/18  2018 Q1    3.2     NA         NA
 ... 
  2     11/7/18  2018 Q4    1.3     NA         NA
 ...
  5      1/1/18  2018 Q1    9.5     NA         NA
  5      1/3/18  2018 Q1    10.1    NA         NA

....

По существу - таблица Customer содержит все данные о клиентах.

Рассматриваемая таблица (куда я хочу получить данные, когда действие = 2) является подмножеством таблицы Customer с некоторым ограничением

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...