У меня ежемесячные отчеты с октября по апрель, и я собрал все данные. Я отсортировал данные по UniqueID, а затем по дате.
Я хочу создать фиктивную переменную, которая будет удовлетворять следующему условию:
1.) Если последнее вхождение определенного UniqueID не в последний месяц (апрель), тогда я хочу, чтобы переменная = 1, иначе 0.
В столбце Freq указано, сколько раз уникальный идентификатор отображается во всем наборе данных с накопленными ежемесячными отчетами.
UniqueID Date Freq
XX343_1 02/01/2019 3
XX343_1 03/01/2019 3
XX343_1 04/01/2019 3
SD229_1 11/01/2018 4
SD229_1 12/01/2018 4
SD229_1 01/01/2019 4
SD229_1 02/01/2019 4
WE321_1 10/01/2018 1
В принципе, я хотел бы получить следующий вывод:
UniqueID Date Freq Dummy
XX343_1 02/01/2019 3 0
XX343_1 03/01/2019 3 0
XX343_1 04/01/2019 3 0
SD229_1 11/01/2018 4 0
SD229_1 12/01/2018 4 0
SD229_1 01/01/2019 4 0
SD229_1 02/01/2019 4 1
WE321_1 10/01/2018 1 1
Я попытался использовать следующий код:
data$Dummy=ifelse(data$Date=="2018-10-01" & data$Freq==1,1,ifelse(
data$Date=="2018-10-01" & data$Freq>=2,0,ifelse(
data$Date=="2018-11-01" & data$Freq<=2,1,ifelse(
data$Date=="2018-11-01" & data$Freq >2,0,ifelse(
data$Date=="2018-12-01" & data$Freq<=3,1,ifelse(
data$Date=="2018-12-01" & data$Freq >3,0,ifelse(
data$Date=="2019-01-01" & data$Freq<=4,1,ifelse(
data$Date=="2019-01-01" & data$Freq >4,0,ifelse(
data$Date=="2019-02-01" & data$Freq<=5,1,ifelse(
data$Date=="2019-02-01" & data$Freq >5,0,ifelse(
data$Date=="2019-03-01" & data$Freq<=6,1,ifelse(
data$Date=="2019-03-01" & data$Freq >6,0,0
))))))))))))
Я продолжаю получать ошибки, и я не уверен, как исправить свои проблемы. Я получаю много ситуаций, когда, если первое появление UniqueID не в октябре, то Dummy будет = 0 в период со второго по последний месяц. Может ли кто-нибудь указать мне правильное направление?