У меня есть список пар (id- (имя-значение)). Вот так
val input = sc.parallelize(Array(Array(1, "a 10"),
Array(1, "b 11"),
Array(3, "a 12"),
Array(3, "b 13"),
Array(3, "c 14"),
Array(4, "b 15")))
Фаза карты имеет ключ - это идентификатор, а значение - (имя-значение) строка.
val rdd = input.map(x => (x(0), x(1)))
Мой ожидаемый результат: для каждого идентификатора сравнивайте значения, основанные на имени, с функцией af ().
Например, с id == "3", мы получили результат после сокращенияфаза:
(key: ab, value: f(12,13))
(key: ac, value: f(12,14))
(key: bc, value: f(13,14))