Apache Pig "Люди, которых вы, возможно, знаете" алгоритм - PullRequest
0 голосов
/ 12 ноября 2018

Я пытаюсь реализовать алгоритм «людей, которых вы, возможно, знаете» в Apache Pig, и я следую этой реализации MapReduce для справки, однако я не знаю, как его запустить.

У меня есть пример данных, таких как:

0 {(1),(2),(3),(6),(8),(9)}
1 {(0),(5),(9)}
2 {(0),(9)}
3 {(0),(4),(5),(7),(9)}
4 {(3),(8)}
5 {(1),(3),(6),(8)}
6 {(0),(5),(9)}
7 {(3),(8)}
8 {(0),(4),(5),(7)}
9 {(0),(1),(2),(3),(6)}

первое значение - это пользователь, а значения в скобках {} - это список друзей, и я читаю его в Pig с:

friends = load 'data.txt' as (user:int, list:{friend:(id:int)});

А сейчас я пытаюсь сгенерировать таблицы взаимных друзей и уже друзей, однако я не знаю, как это сделать, и я пытаюсь зациклить список друзей.

...