У меня есть датафрейм телефонных номеров, электронных писем и имен. Некоторые электронные письма продублированы с разными названиями. Меня не волнует, какое имя останется, поэтому я группируюсь по электронной почте и обобщаю, чтобы выбрать первое наблюдение имени и телефонных номеров. Тем не менее, некоторые адреса электронной почты отсутствуют, но я хочу, чтобы они не группировались, чтобы сохранить уникальные номера телефонов. Используя упрощенный пример, мои данные:
data <- data.frame(x=c(1,2,3,4,5,5,5,6), y=c("a","b","c",NA,"d","d","d",NA))
data %>% group_by(y) %>% summarize(x=first(x))
Я теряю число 6, когда я делаю это. Как мне не дать НС сгруппироваться и обобщиться?