Как мне реализовать метод мощных итераций в pyspark? - PullRequest
1 голос
/ 05 апреля 2019

Я хочу реализовать уравнение, подобное алгоритму ранжирования страниц, используя pyspark.

Традиционно это просто реализовать, но когда я пришел, чтобы спроектировать реализацию в pyspark, я застрял.

Допустим, у нас есть Matrix W измерения (n*n) и вектор x, который изначально инициализирован как (1/n,...,1/n), где n - это номер строки в W.

Предположим, что W задан как фрейм данных pyspark, например:

src dst weight
a    b    0.5
a    c    0.2
etc

, где каждая строка эквивалентна записи в W. Например, в строке a и столбце b у нас есть значение 0.5. Я хочу реализовать уравнение:

x1 = Px
x = x1

Затем повторите эти два действия m раз, где m задано в качестве ввода.

Любая подсказка о том, как выполнить вышеупомянутое действие, будет принята с благодарностью.

...