Ключ карты Pyspark RDD и значения вложенных кортежей - PullRequest
0 голосов
/ 04 мая 2020

Эта таблица показывает, что «пользователь» - «отношение пользователя» и их точки отношения.

Например, в первой строке:

Пользователь3 имеет отношение с пользователем1 и точкой отношения равно 6,

Пользователь3 имеет отношение с пользователем2 и точка отношения равно 4,

Пользователь3 имеет отношение к пользователю5 и точка отношения равно 10,

Пользователь3 имеет отношение к пользователю12 и отношение точка 2

Таблица отношений с пользователем:

  • Пользователь3 Пользователь1 6 Пользователь2 4 Пользователь5 10 Пользователь12 2

  • Пользователь1 Пользователь2 5

  • Пользователь2 Пользователь3 9 Пользователь4 7 Пользователь1 6

Я хочу загрузить эту таблицу и создать значение RDD, чем ключ карты, в этом значении шаблон:

(Пользователь3, (Пользователь1,6)), (Пользователь3, (Пользователь2,5)), (Пользователь3, (Пользователь5,10)), (Пользователь3, (Пользователь12,2)) *

Использование данных не допускается.

...