Добавьте относительное дополнение двух таблиц data.table с помощью rbind - PullRequest
0 голосов
/ 06 февраля 2019

У меня есть ключ data.table, к которому я хотел бы добавить строки из другой таблицы с таким же ключом:

library(data.table)
key.cols <- c("ID", "Code")
set.seed(1)
DT1 = data.table(
  ID = c("b","b","b","a","a","c"),
  Code = LETTERS[seq(1,6)],
  Number = runif(6)
);DT1

DT2 = data.table(
  ID = c("a","a","c","b","b","b"),
  Code = LETTERS[seq(4,9)],
  Number = runif(6)
);DT2

Я хотел бы добавить только к DT1 строки из DT2из ключей, которые не встречаются в DT1, то есть rbind относительное дополнение:

https://en.wikipedia.org/wiki/Complement_(set_theory)#Relative_complement

Я могу попробовать использовать setops и просто добавить ключи, позволяющиестолбцы, заполненные ключом, заполняются NA и присоединяются к ним впоследствии:

DT1 <- rbind(DT1, fsetdiff(DT2[,(key.cols), with=FALSE], DT1[,(key.cols), with=FALSE]), fill=TRUE)
DT1[DT2, Number:=ifelse(is.na(Number), i.Number, Number), on = key.cols];DT1

Есть ли менее громоздкий способ сделать это?

1 Ответ

0 голосов
/ 06 февраля 2019

Чуть менее громоздким является:

rbind(DT1, DT2[!DT1, on = .(ID, Code)])
   ID Code     Number
1:  b    A 0.26550866
2:  b    B 0.37212390
3:  b    C 0.57285336
4:  a    D 0.90820779
5:  a    E 0.20168193
6:  c    F 0.89838968
7:  b    G 0.06178627
8:  b    H 0.20597457
9:  b    I 0.17655675

Возможно, более гибким будет использование unique():

unique(rbind(DT1, DT2), by = c("ID", "Code"))
...