R: Удалить дублированные строки в кадре данных, который содержит значение во втором столбце - PullRequest
2 голосов
/ 16 апреля 2020

У меня есть data.frame() in R, который содержит 3 столбца:

id<-c(12312, 12312, 12312, 48373, 345632, 223452)

id2<-c(1928277, 17665363, 8282922, 82827722, 1231233,12312333)

description<-c(Positive, Negative, Indetermined, Positive, Negative, Positive)

Я хочу удалить дублирующиеся строки с помощью id, которые в description имеют значение Indetermined .

Ответы [ 2 ]

1 голос
/ 16 апреля 2020

Это похоже на пробм для filter(), поэтому:

library(dplyr)

df %>%
  mutate(count = 1) %>% # count all ids
  group_by(id) %>%
  mutate(count = sum(count),Duplicate = count>1) %>% # count how often each id occurs and mark duplicates
  ungroup() %>%
  filter(!Duplicate & description == "Indetermined") # filter out duplicates that are "indetermined"
0 голосов
/ 16 апреля 2020

Не лучший подход, но это должно сработать.

(d <- tibble(id,id2,description))
d[!d$id %in% (d$id[d$description == "Indetermined"]),]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...