Я новичок в программировании Scala, и в настоящее время я работаю с RDD.Я пытаюсь передать RDD в функцию и хотел бы, чтобы функция возвращала его, чтобы я мог сохранить его в новом RDD.Для этой цели я использую карту.Но map вызывает функцию дважды, тогда как внутри RDD есть только одна запись.Он отлично работает, когда я использовал collect.foreach () вместо map, но я не могу сохранить значения обновлений в новом RDD, так как он возвращает значение в Unit.
Этот код возвращает значение из функции обновления, но вызывает функцию дважды:
temp_rdd = my_rdd.map{x => update(x)}
В то время как этот код вызывает его один раз совершенно, но я не могу изменить значения СДР:
my_rdd.collect().foreach{x => update(x)}
Функция foreach возвращает формат в «Единице», поскольку я не могу сохранить его в новом СДР.Я ищу способ сохранить обновленные значения в новом СДР.