Не могли бы вы объяснить, как эта сложная концепция работает на примере?
Из вики hive:
Объединения Sort-Merge-Bucket (SMB) также могут быть преобразованы в объединения карт SMB.Соединения SMB используются везде, где таблицы сортируются и разбиваются на группы.Объединение сводится к простому объединению уже отсортированных таблиц, что позволяет выполнять эту операцию быстрее, чем обычное объединение карты.Однако, если таблицы разбиты на разделы, может произойти замедление, поскольку каждому преобразователю потребуется получить очень маленький фрагмент раздела, который имеет один ключ.
Я не понимаю, когдаон говорит: «Объединение сводится к объединению уже отсортированных таблиц», что это вообще означает?Почему мы их объединяем?Я думал, что мы должны были взять их перекрестный продукт.
Кто-нибудь может привести пример этого алгоритма?