Как объединить два набора данных в один в Pyspark - PullRequest
0 голосов
/ 25 октября 2019

Допустим, у нас есть два набора данных:

Набор данных 1:

id  name    
1   James
2   Tom

Набор данных 2:

id   name
1    Bond
2    Jerry

Я хочу набор данных 3 в следующем формате

Набор данных 3:

id   name
1    James
2    Tom
3    Bond
4    Jerry

Заранее спасибо !!

1 Ответ

0 голосов
/ 25 октября 2019

Довольно просто,

df3 = df1.union(df2)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...