Я пытаюсь создать переменную, которая определяет, является ли строка в векторе первым появлением, в верхних трех или более трех. Например:
В наборе данных ниже у меня есть имя (будет больше имен), текст и переменная dup. Я хочу, чтобы переменная dup определяла, появляется ли текст впервые (источник), находится ли он в пределах первых трех вхождений (FirstThree) или появился более трех раз (MoreThanThree). Я также должен сделать это для каждого человека ... но я думаю, что могу понять эту часть. Заранее спасибо за любую помощь!
name =c("T","T","T","T","T","T","T","T","T","T")
text =c("a","b","a","a","b","c","a","a","b","a")
dup =c("origin","origin","FirstThree","FirstThree","FirstThree","origin","MoreThanThree","MoreThanThree","FirstThree","MoreThanThree")
dfA = data.frame(name,text,dup)
name text dup
1 T a origin
2 T b origin
3 T a FirstThree
4 T a FirstThree
5 T b FirstThree
6 T c origin
7 T a MoreThenThree
8 T a MoreThenThree
9 T b FirstThree
10 T a MoreThenThree