Как зарегистрировать постоянную искру udf? - PullRequest
0 голосов
/ 16 декабря 2018

Я хотел бы использовать свой udf в других сеансах или в представлении, так есть ли способ зарегистрировать постоянный UDF Spark, написанный на Python или scala?

1 Ответ

0 голосов
/ 17 декабря 2018

ты не можешь.У Spark нет «сервера», с которым он общается с менеджером ресурсов (Yarn / Kubernetes / Mesos) и заново развертывается с каждой задачей.Вам нужно либо иметь код в составе пакета, который вы отправляете, либо в предварительной упаковке в файле jar / zip, который вы включаете в работу.В обоих случаях вам нужно зарегистрировать udfs.

...