Последние данные:
last=structure(list(ItemRelation = 11111L, CalendarYear = 2018L, DocumentNum = 111L,
ship_count = 1L), .Names = c("ItemRelation", "CalendarYear",
"DocumentNum", "ship_count"), class = "data.frame", row.names = c(NA,
-1L))
Итак, есть новые данные, где могут быть строки, которые есть в последних данных:
new5=structure(list(ItemRelation = c(11111L, 22222L), CalendarYear = c(2018L,
2017L), DocumentNum = c(111L, 100L), ship_count = c(1L, 23L)), .Names = c("ItemRelation",
"CalendarYear", "DocumentNum", "ship_count"), class = "data.frame", row.names = c(NA,
-2L))
Я должен сравнить новые данные с последними по группеи оставил только эти строки, которые отсутствовали в последнем.
Так что я делаю:
mydat=new5[!(new5$DocumentNum%in% last$DocumentNum), !(new5$CalendarYear%in% last$CalendarYear),
!(new5$ItemRelation%in% last$ItemRelation)]
и результат:
CalendarYear ship_count
2 2017 2
это неверный вывод.
Правильный вывод
ItemRelation CalendarYear DocumentNum ship_count
22222 2017 100 23
Как его получить?