Я хочу избавиться от дубликатов, используя правильную информацию в другом фрейме данных.
Проблема в том, что исходные данные имеют дубликаты как с правильными значениями, так и с неправильными значениями.Правильные значения определены в другом фрейме данных, поэтому я хочу использовать этот фрейм данных в качестве ссылки для этих строк.
Так что задание, которое я хочу сделать условным для двух строк.Чтобы проиллюстрировать это, предположим, что исходные данные tree1
:
tree1 = data.frame(
sp = c("oak","pine","apple","birch","oak","pine","apple","maple"),
code = c(23:26,77,88,99,27))
> tree1
sp code
1 oak 23
2 pine 24
3 apple 25
4 birch 26
5 oak 77
6 pine 88
7 apple 99
8 maple 27
И справочные данные tree2
:
tree2 = data.frame( sp = c("oak","pine","apple"),
code = 23:25)
> tree2
sp code
1 oak 23
2 pine 24
3 apple 25
И мой желаемый вывод, от которого я избавляюсьдубликаты с неправильными значениями, где у меня все еще есть исходные данные, должны выглядеть следующим образом:
> tree3
sp code
1 oak 23
2 pine 24
3 apple 25
4 birch 26
5 maple 27
Я знаю, что это кажется простой условной операцией, но я в итоге удалил некоторые исходные значения или сохранил дубликаты с неправильнымизначения в конце (наоборот не работает).Простая помощь R-base была бы хороша.