Пожалуйста, исправьте меня, если я ошибаюсь, но я подумал, что, используя all.x = TRUE
, нельзя получить строки, которые присутствуют в x
. Я сделал очень простое слияние command
:
basis <<- merge(client[, c("clientID")],
claimsClientTotal[, c("clientID")],
by = "clientID", all.x = TRUE)
Однако в тебе слилось больше строк data.table
, чем в x
- здесь client
. Кроме того, количество дубликатов составляет всего 43
> nrow(client)
[1] 194671
> anyDuplicated(client)
[1] 0
>
> basis <- merge(client[, c("clientID")],
+ claimsClientTotal[, c("clientID")],
+ by = "clientID", all.x = TRUE)
> nrow(basis)
[1] 216764
> anyDuplicated(basis)
[1] 43
. Как это возможно, что число строк в объединенной таблице data.table больше, чем в оригинале, при использовании all.x = TRUE
?
Кроме того, почему всего 43 дубликата, но разница в строке больше 43?
я что-то упустил?