Как и в MapReduce, хеш-соединение Shuffle работает лучше всего, когда данные не перекошены и равномерно распределены по клавишам.
это состояние, которое я читаю о хеш-соединении shuffle.но что, если ключ распределен равномерно, но когда ключ только один для каждого?
- , когда df1 и df2 имели каждую отдельную пару ключей
- когда df1 намного меньше, чем df2?