Я пытаюсь установить подкадр данных, чтобы сохранить только те строки, для которых значение двух переменных отличается от значения ранее сохраненной строки.
Начиная с
df<-structure(list(x = c("ARM018", "ARM018", "ARM018", "ARM021",
"ARM021"), y = c("ARF014", "ARF027", "ARF028",
"ARF014", "ARF020")), class = "data.frame", row.names = c(NA,
-5L))
df
Я хотел бы получить
df_wanted <-structure(list(x = c("ARM018", "ARM021"), y = c("ARF014",
"ARF020")), class = "data.frame", row.names = c(NA, -2L))
df_wanted
, поскольку значения x и y различаются в двух строках
Я предполагал, что функция lag
из пакета dplyr
может помочь и что следующий код вернет df_wanted, но он все же вернет ожидаемый результат
library(dplyr)
df_attempt<-df %>%
filter(lag(x)!=x & lag(y)!=y)
Есть ли какое-либо решение для этого с использованием задержкифункционировать?