Проще говоря, у вас есть полка с 10 стойками и 100 мячей, как показано на картинке. Вы будете настраивать 10 мячей в 1 стойке, как и положено .. 100 мячей в 10 стойках. это balldata.repartition(10)
... таким образом, равномерно распределенные данные (скорее, размещение всех 100 в одной или двух стойках)
Теперь вместо применения любых logi c к каждому шару ( элемент или row ), вы собираетесь применить logi c к каждой стойке (разделу) один раз. - это разница.
В этом случае элемент - это мяч (одна строка), а раздел - это стойка.
Преимущество будет, если вы выполняете тяжелую инициализацию, такую как открытие соединений с базой данных и т. д. c ... для вашей обработки logi c ... вы откроете одно соединение для каждого раздела (Rack :-)), чтобы применить ваш logi c, а не открывать соединение с базой данных для каждого элемента (Ball :-))
Советую go с помощью примеров, приведенных там, чтобы лучше понять
![enter image description here](https://i.stack.imgur.com/casdz.jpg)
любезно / кредиты для изображения здесь