отфильтровать много раз - PullRequest
0 голосов
/ 03 ноября 2019

У меня есть проблема под R с dplyr. У меня есть тиббл с 3 колоннами (идентификатор, количество людей, число выпускников). Я хотел бы сделать это

tibble = filter (number of people == 2000 & number of graduated < 2) %>%
         filter (number of people == 3000 & number of graduated < 3) %>%
         filter (number of people == 4000 & number of graduated < 4) ...

, и до тех пор, пока я не уйдудо максимума моей колонны

Тогда я сделаю переплетение, чтобы создать тиббл с этими строками

Но как я могу продолжить?

1 Ответ

1 голос
/ 03 ноября 2019

Фильтры цепочки, подобные этому, означают, что вы берете подмножество подмножества подмножества и т. Д. Но это сразу же будет пустым, поскольку в строке не может быть number_of_people == 2000 и == 3000, верно? Может быть, вы имеете в виду «или» вместо «и»? Трудно понять, что вы пытаетесь сделать, не видя ваших данных, поскольку ваш вопрос на самом деле не имеет смысла.

Вот мое лучшее предположение:

# create some dummy data
data <- data.frame(
                number_of_people = 1000 * sample(1:10, 100, replace = TRUE),
                number_graduated = sample(1:10, 100, replace = TRUE)
                )

# keep rows where graduates < people/1000
data <- data[data$number_graduated < data$number_of_people/1000, ]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...