Предположим, что есть пользовательский идентификатор, подключенный к столбцу.Как получить строки содержит пользователей, которые ссылаются на все уникальные значения в этом столбце - PullRequest
0 голосов
/ 13 марта 2019

Простой пример

У меня есть разные пользователи (a, b, c) ссылки на другой столбец один

enter image description here

предположим, что я знаю уникальное значение в столбце, которое можно изменить, я хочу извлечь строки, которые пользователи подключают ко всем уникальным значениям в первом столбце, для этого изображения я выберу все строки, содержащие пользователя a. Но в реальных данных миллионы пользователей и больше переменных. Я хочу знать, кто соединяет все уникальные значения в первом столбце и извлекает все строки, содержащие этого пользователя. Может ли кто-нибудь помочь мне в этом?

1 Ответ

1 голос
/ 13 марта 2019

В идеале вы должны опубликовать воспроизводимый пример вместо картинок. Я создал один для тебя на этот раз.

Сначала мы можем найти значения unique в кадре данных, а затем filter те группы, которые имеют all значения unique.

unique_value <- unique(df$value)

library(dplyr)

df %>%
  group_by(group) %>%
  filter(all(unique_value %in% value))

# group value
#  <fct> <dbl>
#1 a         1
#2 a         2
#3 a         3
#4 a         4

Используя базу R, мы можем использовать ave и subset фрейм данных.

subset(df, as.logical(ave(value, group, FUN = function(x) all(unique_value %in% x))))

данные

df <- data.frame(group = c("a", "b", "c", "a", "a", "a", "c"), 
                 value = c(1, 1, 1, 2, 3, 4, 2))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...