Пример данных приведен ниже,
1) Мне нужно удалить людей (ID
s), у которых более одного GroupID
записано в Month
0
.Так, например, FGH
не следует включать в мой анализ.
2) Я хочу рассчитать процент людей (уникальных ID
с), которые имеют одинаковые GroupID
от 0 до 4 месяца подряд (1, 2 и 3 и 4 месяца).(пример ID
ABC
соответствует этому критерию, несмотря на то, что у них есть два идентификатора группы, записанные в месяце 1).
(ID на самом деле 9 цифр).Некоторые идентификаторы имеют несколько идентификаторов группы каждый месяц (например, YUI).
ID Month GroupID
ABC 0 390988
ABC 1 390988
ABC 1 934667
ABC 2 390988
ABC 3 390988
ABC 4 390988
FGH 0 678743
FGH 0 789555
FGH 1 678666
FGH 2 678666
FGH 2 982342
YUI 0 989000
YUI 1 567099
YUI 2 873467
YUI 3 567099
YUI 3 348938
YUI 4 567099
Я немного новичок в R, и я ищу dplyr
/ tidyverse
решение этой, казалось бы, легкой манипуляции.Любая помощь приветствуется!