В определенный момент моего кода у меня есть два разных типизированных набора данных.Мне нужны данные от одного для фильтрации данных к другому.Предполагая, что нет способа изменить код с этого момента, есть ли способ сделать то, что я описываю в комментарии ниже, не собирая все данные из report2D и использовать их внутри функции Spark?
Dataset<Report1> report1Ds ...
Dataset<Report2> report2Ds ...
report1Ds.map((MapFunction<Report3>) report -> {
String company = report.getCompany();
// get data from report2Ds where report2.getEmployeer().equals(company);
}, kryo(Report3.class));
Будем очень благодарны за любые предложения или даже помощь в улучшении дизайна, чтобы избежать подобных случаев.