Ниже приведен мой java-код udf,
package com.udf;
import org.apache.spark.sql.api.java.UDF1;
public class SparkUDF implements UDF1<String, String> {
@Override
public String call(String arg) throws Exception {
if (validateString(arg))
return arg;
return "INVALID";
}
public static boolean validateString(String arg) {
if (arg == null | arg.length() != 11)
return false;
else
return true;
}
}
Я создаю Jar с таким классом как SparkUdf-1.0-SNAPSHOT.jar
У меня есть имя таблицы в качестве образца в улье, и я хотелзапустить ниже sql на оболочке spark.
> select UDF(name) from sample ;
Запуск оболочки spark с помощью следующей команды.
оболочка spark --jars SparkUdf-1.0-SNAPSHOT.jar
Может кто-нибудь сказать, как зарегистрировать UDF на spark shell, чтобы использовать его в spark sql?