Question

У меня есть аналогичный набор данных для следующего:

Я бы хотел добавить столбец, возвращающий 1, пока мы не найдем дубликат A & B, когда мне нужно будет вернуть 0, но только для второго экземпляра, поэтому:

A  B   C  D
1  10  5  1
1  20  1  1
2  30  1  1
2  30  1  0

Любая помощь приветствуется.

M-M · Answer 1 · 29 мая 2019

Просто каракули с library(dplyr):

df %>% group_by(A,B) %>% mutate(D = +((1:n())==1))

Или, если вы хотите, чтобы он был равен нулю «только для второго экземпляра» , то есть третий экземпляр также будет один, тогда работает следующее:

df %>% group_by(A,B) %>% mutate(D = +!((1:n())==2))

В этом примере ваши дубликаты предназначены не только для A и B, но также C. Если это действительно так, вы можете использовать group_by_all вместо group_by(A,B).

вернуть 0 во второй экземпляр дубликата в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

вернуть 0 во второй экземпляр дубликата в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов