Распределение количества частот от одной категории к другой в - PullRequest
0 голосов
/ 12 декабря 2018

У меня есть фрейм данных

emp.data <- data.frame(
  emp_id = c(1:32), 
  dealer_code = c("A1","A2","A3","A4","A5","A3","A8","A4","A6","A6","A7","A1","A8","A9","A1","A2","A7","A8","A1","A1","A2","A2","A5","A4","A4","A10","A10","A10","A10","A3","A3","A11"),
  region = c("UK","US","OZ","IN","US","OZ","UK","IN","PAK","PAK","IN","UK","UK","OZ","UK","US","IN","UK","UK","UK","US","US","US","IN","IN","PAK","PAK","PAK","PAK","OZ","OZ","UK"))

И если я возьму таблицу частот

df <- emp.data %>%
  group_by(dealer_code) %>%
  count() 

, я хочу распространить те коды дилеров, количество которых больше 3, среди тех, чей счетменьше 3, но при условии, что донор и получатель должны иметь одну и ту же область (и многие другие условия)

Ожидаемый результат -

emp.op <- data.frame(
  emp_id = c(1:32), 
  dealer_code = c("A1","A2","A3","A4","A5","A3","A8","A4","A6","A6","A7","A1","A8","A9","A1","A2","A7","A8","A1","A1","A2","A2","A5","A4","A4","A10","A10","A10","A10","A3","A3","A11"),
  region = c("UK","US","OZ","IN","US","OZ","UK","IN","PAK","PAK","IN","UK","UK","OZ","UK","US","IN","UK","UK","UK","US","US","US","IN","IN","PAK","PAK","PAK","PAK","OZ","OZ","UK"),
  changed_code =c("A1","A2","A3","A4","A5","A3","A8","A4","A6","A6","A7","A1","A8","A9","A1","A2","A7","A8","A11","A11","A2","A5","A5","A4","A7","A10","A6","A10","A10","A3","A9","A11"))

Здесь столбец change_code сместил коды дилера и в целомколичество одинаково для одного региона

df_2 <- emp.op %>%
  group_by(changed_code) %>%
  count() 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...