Выбирать только те строки, в которых одно и то же значение присутствует более чем в двух строках - PullRequest
0 голосов
/ 23 октября 2018

У меня есть следующий фрейм данных:

ID    Text    
1234   fsfds
1234   sgge
1234   adfdf
543    sfsf
23     qfsg
23     swfr
6435   iuhg
6435   sonf
6435   ooos

Я бы хотел выбрать только те столбцы, в которых идентификатор присутствует три или более раз, поэтому ожидаемый вывод равен

ID    Text
1234   fsfds
1234   sgge
1234   adfdf
6435   iuhg
6435   sonf
6435   ooos

Как выбрать столбцы с одинаковым значением только в одном столбце?

Я пробовал это, но получил ошибку

library(dplyr)
    myData %>% group_by(ID) %>%
      slice(sort(c(which(ID), which(ID) + 1)))

Error in slice_impl(.data, dots) : 
  Evaluation error: argument to 'which' is not logical.

1 Ответ

0 голосов
/ 23 октября 2018

Вы хотите filter().

library(dplyr)
myData %>% group_by(ID) %>% filter(n() > 2)

Сохраняются только группы с более чем 2 строками.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...