У меня есть следующий набор данных:
id date customer_id
1 02/03/2018 undefined
1 04/23/2018 12
1 05/22/2018 12
1 06/25/2018 undefined
2 01/14/2017 undefined
2 02/23/2018 undefined
2 03/04/2018 23
2 04/04/2018 23
Я хочу сгруппировать эти данные по идентификатору и отсортировать их внутри группы по дате.Теперь вот часть, которую я не могу понять.Я хочу, чтобы был способ проверить, что для каждой отсортированной группы за значением customer_id "undefined" следуют цифры, а это означает, что в приведенном выше случае id == 2 - это то, что я хочу сохранить, поскольку у него есть "undefined" s.вместе и после этого у нас есть только номер.Идея состоит в том, что когда customer_id не определен, они не являются клиентами, но со временем, как только они становятся клиентами, «значение» меняется на число, которое является идентификатором клиента.Так что в этом случае id == 1 - плохая запись, и я хочу отменить ее и оставить только id == 2.
data %>% group_by(id) %>%
arrange(date) %>% "code to keep only records that have all
the undefined in customer_id together and after only numbers,
in this case, I want to only keep id == 2 records"
Спасибо.