Чтобы зарегистрировать UDF в Spark SQL с помощью Java, вы можете использовать следующий код:
sparkSession.udf().register("lowercase_udf", new LowerCase_UDF(), DataTypes.StringType);
И тогда вы можете использовать его так:
dataset.withColumn("lower", functions.callUDF("lowercase_udf", functions.col("value")));
Это даст вам что-то вроде этого:
+--------+-------+
|value |lower |
+--------+-------+
|Michael |michael|
|Andy |andy |
|Justin |justin |
+--------+-------+
Надеюсь, это поможет!