Как видно из заголовка, я пытаюсь создать внешние модули, которые впоследствии импортируются и запускаются в простой функции rdd.map
.Пример ниже:
## main.py ##
myrdd = spark.sparkContext.parallelize([1,2,3,4,5])
spark.sparkContext.addPyFile("myModule.py")
import myModule as mm
myrdd.map(lambda x: mm.Module.test(x)).collect()
## myModule.py ##
class Module():
def test(self,x):
return x * 2
При попытке запустить это с помощью spark submit я получаю следующую ошибку:
test() missing 1 required positional argument: 'x'
Может кто-нибудь указать на ошибку?
Спасиботы очень