Есть учетная запись ids
, каждый с timestamp
, сгруппированным по username
.для каждого из этих групп имен пользователей мне нужны все пары (самая старая учетная запись, другая учетная запись).
У меня есть Java-редуктор, который делает это, могу ли я переписать его как простой сценарий pig?
Схема:
{group:(username),A: {(id , create_dt)}
Ввод:
(batman,{(id1,100), (id2,200), (id3,50)})
(lulu ,{(id7,100), (id9,50)})
Желаемый выход:
(batman,{(id3,id1), (id3,id2)})
(lulu ,{(id9,id7)})