Я новичок в Spark, у меня есть два набора данных, определенных ниже:
Dataset<A> dsA;
Dataset<B> dsB;
Class A{
int id;
string name;
}
Class B{
A objA;
int id2;
string other;
}
dsB с миллионами записей, dsA имеет почти такое же количество записей, как dsB.
Хотите найти совпадающие записи (a.id == b.id2), а затем скопировать значения из dsA в objA в dsB.
Каков наилучший способ достижения этого?
Спасибо.