Альтернатива UNION и DISTINCT в спарк спл - PullRequest
0 голосов
/ 05 июня 2018

Я пытаюсь объединить две версии одного и того же набора данных (из разных источников данных, GS Bucket и Kafka) с только разными значениями в результате.Хотя UNION и DISTINCT - очевидное решение, я искал более экономичный способ сделать это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...