Исключающие UDAF для параллельной обработки данных на уровне группы, но в каждой группе последовательно обрабатываются строки - PullRequest
0 голосов
/ 07 ноября 2019

Мы подробно обсудили нашу постановку проблемы здесь spark sql: Как добиться параллельной обработки фрейма данных на уровне группы, но в каждой группе нам требуется последовательная обработка строк

Посколькубизнес-кейс немного сложен, мы пробуем все возможные варианты с большой искрой данных на этом этапе.

Может кто-нибудь, пожалуйста, помогите понять, если использование Spark UDAFs является возможным подходом для решения вышеупомянутого варианта использования, пожалуйста,.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...