R Показать дубликаты в кадре данных - PullRequest
0 голосов
/ 13 сентября 2018

Я пытаюсь «выделить» дубликаты в моем фрейме данных.Я нашел различные учебники по удалению дубликатов или созданию нового набора данных, содержащего только дубликаты.Но так как я ожидаю, что что-то пошло не так на ранних этапах моей работы с данными, я (на данный момент) просто хотел бы увидеть, какие наблюдения кажутся дублирующими, чтобы понять, что пошло не так.Я хотел бы, чтобы R создал столбец c

a <- c("C","A","A","B","A","C","C")
b <- c(1,1,2,1,2,1,2)
c <- c(2,1,2,1,2,2,1)
df <-data.frame(a,b,c)

1 Ответ

0 голосов
/ 13 сентября 2018
a <- c("C","A","A","B","A","C","C")
b <- c(1,1,2,1,2,1,2)
df <-data.frame(a,b)

library(dplyr)

df %>%
  group_by(a,b) %>%    # for each combination of a and b
  mutate(c = n()) %>%  # count times they appear
  ungroup()

# # A tibble: 7 x 3
#   a         b     c
#   <fct> <dbl> <int>
# 1 C         1     2
# 2 A         1     1
# 3 A         2     2
# 4 B         1     1
# 5 A         2     2
# 6 C         1     2
# 7 C         2     1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...