Question

В настоящее время у меня есть кадр данных, который выглядит примерно так:

Я хочу удалить целую группу идентификаторов, если есть повторяющиеся значения. Итак, вывод, который я хочу, это:

Я сталкивался с решениями по удалению отдельных строк, но не фрагментов данных. Буду ли я использовать цикл для этого?

Sotos · Answer 1 · 12 апреля 2019

В базе R,

df[!df$ID %in% unique(df$ID[duplicated(df)]),]

#   ID val
#1   1   a
#2   1   b
#6   3   c
#7   3   a
#8   4   a
#9   5   a
#10  5   b

akrun · Answer 2 · 12 апреля 2019

Вот еще один base R метод, который использует table с rowSums для определения идентификаторов для сохранения

df[df$ID %in% names(which(!rowSums(table(df) > 1))),]
#    ID val
#1   1   a
#2   1   b
#6   3   c
#7   3   a
#8   4   a
#9   5   a
#10  5   b

Ronak Shah · Answer 3 · 12 апреля 2019

С помощью dplyr мы можем group_by ID и выбирать группы, если в группе нет дубликатов.

library(dplyr)

df %>%
  group_by(ID) %>%
  filter(!any(duplicated(val)))

#     ID val  
#  <int> <fct>
#1     1 a    
#2     1 b    
#3     3 c    
#4     3 a    
#5     4 a    
#6     5 a    
#7     5 b

или с использованием базы R ave

df[!with(df, as.logical(ave(val, ID, FUN = function(x) any(duplicated(x))))), ]

Как разделить данные, а затем удалить группы, если есть дубликаты?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как разделить данные, а затем удалить группы, если есть дубликаты?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов