У меня есть следующий фрейм данных R dplyr в df_pub (Данные публикации науки / природы)
Обратите внимание, что существуют одинаковые PMID (или бумага)с участием авторов в каждой строке (информация об авторах здесь не отображается).
Мне нужно выбрать и сохранить публикации (PMID), к которым не прикреплено электронное письмо, и сохранить последнее наблюдение за ним во фрейме данных.
На самом деле я хочу удалить все PMID, имеющие какие-либоэлектронная почта в любом наблюдении.Мне нужно собрать публикации (PMID), к которым не прикреплено электронное письмо, а затем найти последнего автора или последнее наблюдение (обычно она / он / xe являются руководителем группы или PI, мы свяжемся с ними вручную и попросим ихобновите их электронную почту).
Так, для приведенного выше примера ожидаемый вывод не будет содержать PMID 22522932, поскольку к нему прикреплено электронное письмо.Для других PMID будет храниться только последняя строка каждого такого PMID.
Я начал с этого, но затем потерял
df_pub %>%
group_by(pmid) %>%
filter(is.na(email)) # This does not do the expected