У меня есть вопросы, когда я пытаюсь реализовать PageRank с помощью mapreduce.
Я хочу привести здесь коды https://stackoverflow.com/a/5029780/1117436 для описания проблемы.
map ((url,PR), out_links) //PR = random at start
for link in out_links
emit(link, ((PR/size(out_links)), url))
reduce(url, List[(weight, url)):
PR =0
for v in weights
PR = PR + v
Set urls = all urls from list
emit((url, PR), urls)
В вышеописанном процессе очевидно, что вторым параметром ввода процедуры map являются ссылки Out в url, но вторым параметром вывода процедуры Reduction представляется ссылки In в URL. Так как эти коды могут работать итеративно?
Тогда я хочу спросить, как писать коды для правильной работы алгоритма PageRank?
ОБНОВЛЕНИЕ: я думаю, что этот ответ решает мою проблему.
https://stackoverflow.com/a/13568286/1117436