Допустим, у меня есть следующий набор данных «ключа»:
key = read.table(text = "question r_answer d_answer
20 A B
21 B A
22 A B
23 B A
24 A B
25 B A", header = T)
> key
question r_answer d_answer
1 20 A B
2 21 B A
3 22 A B
4 23 B A
5 24 A B
6 25 B A
Это говорит мне, что для данного вопроса, какой ответ даст «R», и какой ответ даст «D» ,
Теперь предположим, что это набор данных:
data = read.table(text = "person_id question answer
1 20 A
1 21 B
1 22 A
1 23 B
1 24 A
1 25 B
2 20 A
2 21 A
2 23 A
2 24 B
2 25 B", header = T)
>data
person_id question answer
1 1 20 A
2 1 21 B
3 1 22 A
4 1 23 B
5 1 24 A
6 1 25 B
7 2 20 A
8 2 21 A
9 2 23 A
10 2 24 B
11 2 25 B
Это говорит мне, для данного человека, каковы были его реальные ответы. Я хочу создать в данных столбец answer_type
, равный r_answer
или d_answer
в зависимости от значений, указанных в ключе. В результате вы получите:
person_id question answer answer_type
1 1 20 A r_answer
2 1 21 B r_answer
3 1 22 A r_answer
4 1 23 B r_answer
5 1 24 A r_answer
6 1 25 B r_answer
7 2 20 A r_answer
8 2 21 A d_answer
9 2 23 A d_answer
10 2 24 B d_answer
11 2 25 B r_answer
У меня такое ощущение, что ответом будет слияние с dplyr, но я не могу понять это.