У меня есть фрейм данных со столбцами
shipment_id created_at picked_at packed_at shipped_at
CSDJKH231BN 2019-02-03 2019-02-03
CSDJKH231BN 2019-02-03 2019-02-03 2019-02-04 2019-02-05
CSDJKH2KFJ3 2019-02-01 2019-02-04 2019-02-07
База данных загружается в rServer через google-диск, который постоянно обновляется.
u1 <- "https://docs.google.com/spreadsheets/d/e/"link""
tc1 <- getURL(u1, ssl.verifypeer=FALSE)
x <- read.csv(textConnection(tc1))
Если в первом обновлении shipment_id CSDJKH231BN было выбрано, а во втором обновлении с диска Google, мы получаем CSDJKH231BN до shipped_at.Как сохранить только shipment_id, которые являются до shipped_at, но я также хочу сохранить shipment_id, например CSDJKH2KFJ3, которые еще должны быть обработаны и еще не отправлены.
В основном просто для удаления дублирующихся записей, но этот кодне работает для меня.
df <- df[!duplicated(df), ]
Любая помощь будет оценена.