Я работаю с PySpark, используя фабрику mixin двух классов
Но каждый раз, когда функция карты называется ядром, он просто ломается, пытается отладить и найти соответствующее решение, но не находит поддержки.
На данный момент у меня есть несколько классов, эти классы называются в соответствии с потребностями
Интересно, что этот формат работал в предыдущей версии Spark (1.6), но позже не работает с последней Spark 2.0
Я полагаю, это из-за противоречивого названия мета-класса среди рабочих ...
Итак, исправление или какая-либо ссылка будет высоко ценится
def mixin_factory(name, base, mixin):
class _tmp(base, mixin):
pass
_tmp.__name__ = name
return _tmp
def Mix_map_function(dataframe) :
MixClass = mixin_factory("MixClass", Class_A, Class_B)
MixClass( .... , dataframe ) # class initialization parameters using constructor
PiplinedRDD.map(lambda x: Mix_map_function(x[0]) , preservesPartitioning=True )
# x[0] some partitioned data from rdd