Как пометить повторяющиеся значения в r - новичок - PullRequest
0 голосов
/ 19 января 2019

Я пытаюсь пометить дубликаты идентификаторов в другом столбце. Я пока не хочу их удалять, просто создайте индикатор (0/1) того, уникальны ли идентификаторы или дубликаты. В sql это было бы так:

ВЫБРАТЬ ID, считать (ID) считать из TABLE группы по ID) a TABLE. ID = a. ID установить ID Duplicate Flag Column 1 = 1 где count> 1;

Есть ли способ сделать это просто в r? Любая помощь будет принята с благодарностью.

1 Ответ

0 голосов
/ 19 января 2019

В качестве примера duplicated давайте начнем с некоторых значений (числа здесь, но строки будут делать то же самое)

x <- c(9, 1:5, 3:7, 0:8)
x
# 9 1 2 3 4 5 3 4 5 6 7 0 1 2 3 4 5 6 7 8 

Если вы хотите пометить вторую и более поздние копии

as.numeric(duplicated(x))
# 0 0 0 0 0 0 1 1 1 0 0 0 1 1 1 1 1 1 1 0

Если вы хотите пометить все значения, которые встречаются два или более раз

as.numeric(x %in% x[duplicated(x)])
# 0 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0
...