R Studio - удалить дубликаты, и один столбец больше другого столбца - PullRequest
0 голосов
/ 27 апреля 2020

Я хочу удалить дублированный «идентификатор» и оставить записи, когда «значение1» больше, чем «значение2». Я стараюсь избегать для l oop, потому что у меня большой кадр данных. Цените свое время!

enter image description here

Ответы [ 2 ]

1 голос
/ 27 апреля 2020

Используя библиотеку dplyr, вы можете использовать

library(dplyr)
df %>%
filter(value1 > value2)

Это покажет всем строкам, что значение1 больше соответствующего значения2.

Из вашего вопроса не ясно, достаточно ли этого для удаления всех повторяющихся значений идентификаторов - как вы будете обрабатывать, это будет зависеть от вашей цели и структуры ваших данных (есть ли идентификаторы, которые имеют несколько соответствует вашим критериям (если да, то хотите ли вы сохранить все из них или только первый / последний / один с наибольшим значением / некоторые другие критерии)

0 голосов
/ 27 апреля 2020

Мы также можем использовать subset от base R

subset(df, value1 > value2)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...