У меня есть фрейм данных
emp.data <- data.frame(
emp_id = c(1:32),
dealer_code = c("A1","A2","A3","A4","A5","A3","A8","A4","A6","A6","A7","A1","A8","A9","A1","A2","A7","A8","A1","A1","A2","A2","A5","A4","A4","A10","A10","A10","A10","A3","A3","A11"),
region = c("UK","US","OZ","IN","US","OZ","UK","IN","PAK","PAK","IN","UK","UK","OZ","UK","US","IN","UK","UK","UK","US","US","US","IN","IN","PAK","PAK","PAK","PAK","OZ","OZ","UK"))
И если я возьму таблицу частот
df <- emp.data %>%
group_by(dealer_code) %>%
count()
, я хочу распространить те коды дилеров, количество которых больше 3, среди тех, чей счетменьше 3, но при условии, что донор и получатель должны иметь одну и ту же область (и многие другие условия)
Ожидаемый результат -
emp.op <- data.frame(
emp_id = c(1:32),
dealer_code = c("A1","A2","A3","A4","A5","A3","A8","A4","A6","A6","A7","A1","A8","A9","A1","A2","A7","A8","A1","A1","A2","A2","A5","A4","A4","A10","A10","A10","A10","A3","A3","A11"),
region = c("UK","US","OZ","IN","US","OZ","UK","IN","PAK","PAK","IN","UK","UK","OZ","UK","US","IN","UK","UK","UK","US","US","US","IN","IN","PAK","PAK","PAK","PAK","OZ","OZ","UK"),
changed_code =c("A1","A2","A3","A4","A5","A3","A8","A4","A6","A6","A7","A1","A8","A9","A1","A2","A7","A8","A11","A11","A2","A5","A5","A4","A7","A10","A6","A10","A10","A3","A9","A11"))
Здесь столбец change_code сместил коды дилера и в целомколичество одинаково для одного региона
df_2 <- emp.op %>%
group_by(changed_code) %>%
count()