Существует проблема, с которой я сталкиваюсь при отслеживании обновленных полей в spark RDD. Предположим, что у нас есть СДР, подобный этому:
(1,2)
(2,10)
(5,9)
(3,8)
(8,15)
на основании некоторых условий значение некоторого keys
может измениться. например, значение key=2
изменяется с 10 на 11. тогда значение ключа в СДР, значение которого равно ключу обновленной строки, должно быть соответственно изменено. например, key=1
имеет значение, равное 2, которое 2 является ключом в другой строке. поскольку значение ключа = 2 изменяется на 11. тогда значение ключа = 1 должно измениться на 11 на. после некоторого выполнения СДР выглядит так:
(1,11)
(2,11)
(5,9)
(3,7)
(8,7)
Есть ли эффективный способ реализовать это?