Создание колонки владения в Days in R - PullRequest
0 голосов
/ 25 октября 2018

* Отредактировано

Я пытаюсь создать столбец в df, который показывает мне номер дня в период пребывания клиента.Вот код для создания фиктивного df для этого: -

     Date<-c("20/07/2018", "21/07/2018", "25/07/2018", "02/08/2018", "05/08/2018", "10/08/2018")
     ClientId<-c("aaa", "bbb", "ccc", "aaa", "bbb", "ccc")
     EventId<-c("klk109", "rrt234", "hjk786", "yyu777", "tyw909", "nnl991")
     dateclient<-cbind(Date, ClientId)
     LoginDates<-cbind(dateclient, EventId)
     View(LoginDates)

, который должен дать вам что-то вроде этого: -

   head(LoginDates)

      Date     ClientId  EventId 
  "20/07/2018" "aaa"    "klk109"
  "21/07/2018" "bbb"    "rrt234"
  "25/07/2018" "ccc"    "hjk786"
  "02/08/2018" "aaa"    "yyu777"
  "05/08/2018" "bbb"    "tyw909"
  "10/08/2018" "ccc"    "nnl991"

По сути, я хочу создать столбец для добавленияв конце, как это

     Date    ClientId  EventId   tenureDay
 "20/07/2018" "aaa"    "klk109"      1
 "21/07/2018" "bbb"    "rrt234"      1
 "25/07/2018" "ccc"    "hjk786"      1
 "02/08/2018" "aaa"    "yyu777"     13
 "05/08/2018" "bbb"    "tyw909"     15
 "10/08/2018" "ccc"    "nnl991"     16

Тем не менее, моя главная проблема в моем наборе данных (вышеприведенное - фиктивный df), у некоторых клиентов было более одного взаимодействия в день (у некоторых было 10, 20 и т. д.).на).Код, который я написал (цикл for и некоторый код data.table), возвратил количество взаимодействий (или EventIds), а не число дней в сроке пребывания.Если клиент был в службе в течение 10 дней и имел, скажем, 4 взаимодействия в течение этого времени, я хочу, чтобы столбец tenureDay представлял день в их сроке службы, в который произошло конкретное взаимодействие.

Надеюсь, что это делаетсмысл, огромное спасибо заранее!:)

1 Ответ

0 голосов
/ 25 октября 2018

Спасибо за изменение вопроса!

Для воспроизведения:

LoginDates <- fread("Date     ClientId  EventId 
                    2018-07-20 aaa    klk109
                    2018-07-21 bbb    rrt234
                    2018-07-25 ccc    hjk786
                    2018-08-02 aaa    yyu777
                    2018-08-05 bbb    tyw909
                    2018-08-10 ccc    nnl991")

Используя dplyr, вы можете попробовать это:

LoginDates %>%
  group_by(ClientId) %>%
  mutate(tenureDay = as.Date(Date) - head(as.Date(Date),1))

Я действительно надеюсьэто решит вашу проблему!

РЕДАКТИРОВАТЬ:

Если вы не хотите, чтобы ваш результат отображался как x Days, попробуйте:

LoginDates %>%
  group_by(ClientId) %>%
  mutate(tenureDay = as.numeric(as.Date(Date) - head(as.Date(Date),1)))
...