Как объединить наборы данных Spark A и B и отметить записи в A, которые не были объединены? - PullRequest
0 голосов
/ 18 января 2020

У меня есть два набора данных A и B с TypeA и TypeB соответственно. Затем я соединяю наборы данных, основанные на столбце (давайте назовем это «ключом»), чтобы получить набор данных C. После этого мне нужно отменить события в наборе данных A, которые были объединены с B, и сохранить только те события в A, которые не могли быть объединены. Как я go об этом?

1 Ответ

0 голосов
/ 18 января 2020

То, что вы ищете, это левый анти-объединение. Проверьте это сообщение для получения более подробной информации Оставить Anti присоединиться к Spark?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...