Вот мои данные:
ITEM <- c("A","A","A","B","B","B","B","C","C","D","D","E","E","F","G","G","G")
LOCATION <- c("aaa","bbb","ccc","bbb","fff","ggg","zzz","zzz","eee","hhh","iii","kkk","jjj","iii","iii","yyy","xxx")
df <- as.data.frame(cbind(ITEM,LOCATION))
Long Form:
ITEM LOCATION
1 A aaa
2 A bbb
3 A ccc
4 B bbb
5 B fff
6 B ggg
7 B zzz
8 C zzz
9 C eee
10 D hhh
11 D iii
12 E kkk
13 E jjj
14 F iii
15 G iii
16 G yyy
17 G xxx
Широкая форма (легче читать):
ITEM LOCATION.1 LOCATION.2 LOCATION.3 LOCATION.4
A aaa bbb ccc <NA>
B bbb fff ggg zzz
C zzz eee <NA> <NA>
D hhh iii <NA> <NA>
E kkk jjj <NA> <NA>
F iii <NA> <NA> <NA>
G iii yyy xxx <NA>
Первоначально я группировал Предмет вручную, когда местоположения пересеклись.
т.е. Я сгруппируюсь в {A, B, C}, {D, F, G}, {E}
Мои необработанные данные содержат 8000 строк, и это занимает несколько дней.
Когда набор данных небольшой, я могу использовать левое соединение и получить желаемый результат
но когда набор данных большой, я не могу его использовать.
Может ли какой-либо пакет сгруппировать элемент по объединению?