Я пытаюсь воспроизвести этот пример из официальной документации:
spamInfoRDD = sc.pickleFile(...) # RDD containing spam information
# join data stream with spam information to do data cleaning
cleanedDStream = wordCounts.transform(lambda rdd: rdd.join(spamInfoRDD).filter(...))
Однако я получаю сообщение об ошибке SPARK-5063, в котором говорится, что я хочу преобразовать СДР внутри функции преобразования, т.е. я хочу преобразовать spamInfoRDD. Но вы можете видеть, что здесь преобразуются только rdds в wordcount.
Кто-нибудь раньше получал эту ошибку?