Question

Я хочу удалить дублированный «идентификатор» и оставить записи, когда «значение1» больше, чем «значение2». Я стараюсь избегать для l oop, потому что у меня большой кадр данных. Цените свое время!

Brian Fisher · Answer 1 · 27 апреля 2020

Используя библиотеку dplyr, вы можете использовать

library(dplyr)
df %>%
filter(value1 > value2)

Это покажет всем строкам, что значение1 больше соответствующего значения2.

Из вашего вопроса не ясно, достаточно ли этого для удаления всех повторяющихся значений идентификаторов - как вы будете обрабатывать, это будет зависеть от вашей цели и структуры ваших данных (есть ли идентификаторы, которые имеют несколько соответствует вашим критериям (если да, то хотите ли вы сохранить все из них или только первый / последний / один с наибольшим значением / некоторые другие критерии)

akrun · Answer 2 · 27 апреля 2020

Мы также можем использовать subset от base R

subset(df, value1 > value2)

R Studio - удалить дубликаты, и один столбец больше другого столбца

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

R Studio - удалить дубликаты, и один столбец больше другого столбца

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов