У меня есть ниже упомянутый фрейм данных:
DF <- read.table(text = "
Date ID
2018-04-01 K-1
2018-04-01 K-1
2018-04-01 K-8
2018-04-02 K-2
2018-04-02 K-2
2018-04-03 K-2
2018-04-03 K-2
2018-04-03 K-2
2018-04-04 K-3
2018-05-01 K-5
2018-05-01 K-5
2018-05-02 K-6
2018-05-02 K-7", header = TRUE, stringsAsFactors = FALSE)
Используя вышеупомянутый фрейм данных, я хочу определить нижеупомянутый показатель:
Date Unique_count Duplicate_Count Overall_Duplicate
2018-04-01 2 1 0
2018-04-02 1 1 0
2018-04-03 0 0 3
2018-04-04 1 0 0
2018-05-01 1 1 0
2018-05-02 2 0 0
Где:
Unique_count
- Отличительный ID
, созданный для определенной даты, ID
не должен совпадать с любым предыдущим ID
.
Duplicate_count
- число дополнительных (если 2 K-1
, чем - Duplicate_count
должно быть 1) одинаковое ID
, сгенерированное для конкретной даты, такое же ID
не должен совпадать с любым предыдущим ID
.
Overall_Duplicate
- счетчик ID
, который был сгенерирован ранее и снова присутствует на определенную дату.
У меня есть указанный ниже код, не уверен насчет Overall_Duplicate
:
library(dplyr)
DF2 <- DF %>%
group_by(Date) %>%
summarise(Unique_Count = n_distinct(ID),
Duplicate_Count = sum(table(ID)>1))