Я собираюсь распространить таблицу, однако я столкнулся с проблемой с моими данными.Данные основаны на вопроснике, и вопросы находятся в 1 столбце, а ответы - в следующем столбце.Этот файл данных содержит около 20000 анкет, все они вставлены друг под другом.
Это выглядит так:
*Participant* | *Question* | *Answer*
Paul | Age | 15
Paul | City | Amsterdam
Paul | Pet_name | Butterfly
Paul | Fav_color | Pink
Paul | Parent_name | Hank
Paul | Parent_name | Mary
Adam | Age | 78
Adam | City | LA
Adam | Pet_name | Crocodile
Adam | Fav_color | Purple
Adam | Parent_name | Pete
Adam | Parent_name | Peter
Проблема в том, что я не могу распространяться, когда два вопроса называются одинаковыми, в случае "Parent_name".
Поэтому желательно, чтобы второе вхождение Parent_name для каждого участника заменялось чем-то вроде Parent2_name или Parent_name2
. Я пытался идентифицировать дублирующиеся значения с помощью * 1010.* функция, однако, так как все вопросы повторяются, она просто помечает все, от второго участника, как дублированные
Чтобы воссоздать мои данные примера:
Participant <- c('Paul','Paul','Paul','Paul','Paul','Paul', 'Adam', 'Adam', 'Adam', 'Adam', 'Adam', 'Adam' )
Question <- c('Age', 'City', 'Pet_name', 'Fav_color', 'Parent_name', 'Parent_name', 'Age', 'City', 'Pet_name', 'Fav_color', 'Parent_name', 'Parent_name')
Answer <- c('15', 'Amsterdam', 'Butterfly', 'Pink', 'Hank', 'Mary', '78', 'LA', 'Crocodile', 'Purple', 'Pete', 'Peter')
df <- data.frame(Participant, Question, Answer)
Таким образом, конечный продукт будет выглядеть так:
*Participant* | *Question* | *Answer*
Paul | Age | 15
Paul | City | Amsterdam
Paul | Pet_name | Butterfly
Paul | Fav_color | Pink
Paul | Parent_name | Hank
Paul | Parent2_name | Mary
Adam | Age | 78
Adam | City | LA
Adam | Pet_name | Crocodile
Adam | Fav_color | Purple
Adam | Parent_name | Pete
Adam | Parent2_name | Peter