Я использую Spark 2.4.1 с Java 8 в моем проекте.
У меня есть сценарий, в котором мне нужно найти другую таблицу / набор данных, который имеет два поля, то есть название страны и страну -code.
В другом потоке данных будет столбец кода страны, мне нужно отобразить соответствующее название страны в целевом / результирующем фрейме данных.
Насколько я знаю, мы можно использовать соединение для достижения вышеизложенного, используя широковещательную переменную и соединение.
Итак, с точки зрения производительности, какой из них лучше здесь? Какой стандарт искры подходит для такого рода сценариев использования?