Можно иметь массив разделов Spark DataFrame
следующим образом:
> df.rdd.partitions
Есть ли способ получить больше информации о разделах?В частности, я хотел бы видеть ключ раздела и границы раздела (первый и последний элемент в разделе).
Это просто для лучшего понимания того, как организованы данные.
Это то, что я пробовал:
> df.partitions.rdd.head
Но этот объект имеет только атрибуты и методы equals
hashCode
и index
.