Spark копирует значения из одного набора данных в другой - PullRequest
0 голосов
/ 23 марта 2020

Я новичок в Spark, у меня есть два набора данных, определенных ниже:

Dataset<A> dsA;
Dataset<B> dsB;

Class A{
int id;
string name;
}

Class B{
A objA;
int id2;
string other;

}

dsB с миллионами записей, dsA имеет почти такое же количество записей, как dsB.

Хотите найти совпадающие записи (a.id == b.id2), а затем скопировать значения из dsA в objA в dsB.

Каков наилучший способ достижения этого?

Спасибо.

...