Используйте case_when функцию dplyr с соединением между двумя наборами данных - PullRequest
0 голосов
/ 07 ноября 2018

У меня есть следующие два примера наборов данных, и я хочу использовать функцию case_when в качестве комбинации двух наборов данных:

game_data <- data.frame(player = c(1,1,1,2,2,2,3,3,3), level = c(1,2,3,1,2,3,1,2,3), score=c(0,150,170,80,100,110,75,100,0))
> game_data
  player level score
1      1     1     0
2      1     2   150
3      1     3   170
4      2     1    80
5      2     2   100
6      2     3   110
7      3     1    75
8      3     2   100
9      3     3     0
> 
> range_data <- data.frame(level = c(1,2,3), Point1 = c(20,70,140), Point2 = c(40,80,180), Point3 = c(60,90,220))
> range_data
  level Point1 Point2 Point3
1     1     20     40     60
2     2     70     80     90
3     3    140    180    220
> 

Теперь я хочу использовать диапазоны между точками во втором наборе данных для создания новой переменной в наборе данных game_data на основе диапазона между оценками. Например, если оценка пользователя 1 находится на уровне 2 на уровне 150, новая переменная PointRange должна отображать «Range4», поскольку она выше 90.

Я пробовал следующее, но оно не работает:

result <- game_data %>%
  mutate(PointRange = case_when(level == range_data$level & score <  range_data$point1 ~ "Range1",
                                level == range_data$level & score >= range_data$point1 & score < data$point2 ~ "Range2",
                                level == range_data$level & score >= range_data$point2 & score <= data$point3 ~ "Range3",
                                level == range_data$level & score >= range_data$point3 ~ "Range4"))

Как мне это сделать? Заранее спасибо!

1 Ответ

0 голосов
/ 07 ноября 2018

Поскольку вы сопоставляете столбец уровня, вы можете просто inner_join этот столбец и затем работать с одним фреймом данных.

аргументы оцениваются по порядку, поэтому необходимо перейти от самого конкретного к наиболее общему.

game_data %>%
  inner_join(range_data, by = "level") %>%
  mutate(PointRange = case_when(score>=Point3 ~ "Range4",
                                score>=Point2 ~"Range3",
                                score>=Point1 ~"Range2",
                                score<Point1 ~"Range1")) %>%
  select(-Point1,-Point2,-Point3)

#  player level score PointRange
#1      1     1     0     Range1
#2      1     2   150     Range4
#3      1     3   170     Range2
#4      2     1    80     Range4
#5      2     2   100     Range4
#6      2     3   110     Range1
#7      3     1    75     Range4
#8      3     2   100     Range4
#9      3     3     0     Range1
...