Работают ли определяемые пользователем функции (UDF) в SPARK распределенным образом, если данные хранятся на разных узлах, или все данные накапливаются в главном узле для обработки? Если он работает распределенным образом, то можем ли мы преобразовать любую функцию из python, предопределенную или определяемую пользователем, в искровой UDF, как указано ниже:
spark.udf.register ("myFunctionName ", functionNewName)