У меня есть кадр данных, подобный следующему:
df <- data.frame(cbind((c(2018,2018,2018,2018,2018,2017,2017,2016)),
(c('Ohio','Ohio','Arizona','Arizona','Nebraska','Nebraska','New Mexico','Idaho')),
(c('A','B','C','D','E','F','G','H')), (c(1,2,3,4,5,6,7,8))))
colnames(df) <- c('Date', 'Location', 'Var1', 'Var2')
Date Location Var1 Var2
2018 Ohio A 1
2018 Ohio B 2
2018 Arizona C 3
2018 Arizona D 4
2018 Nebraska E 5
2017 Nebraska F 6
2017 New Mexico G 7
2016 Idaho H 8
И я пытаюсь ввести новую переменную 'Combo', которая будет представлять каждую уникальную комбинацию переменных 'Date' и 'Location', напримерчто любой ряд наблюдений с одинаковыми датой и местоположением будет иметь одинаковое «комбинированное» значение.Я надеюсь, что это будет выглядеть примерно так:
Date Location Var1 Var2 Combo
2018 Ohio A 1 1
2018 Ohio B 2 1
2018 Arizona C 3 2
2018 Arizona D 4 2
2018 Nebraska E 5 3
2017 Nebraska F 6 4
2017 New Mexico G 7 5
2016 Idaho H 8 6
Так что каждое комбинированное значение совместно используется всеми строками, которые имеют одинаковую комбинацию даты и местоположения, независимо от других переменных в этой строке.
Я пытался использовать комбинацию mutate()
и distinct()
, но безуспешно.Я надеюсь на простое решение, которое чем-то похоже на:
У кого-нибудь есть идеи по этому поводу?Я пытался найти в документации для distinct()
и unique()
идеи, но не повезло.
Любая помощь очень ценится!