Вы можете сделать repartition
на своем входном DataFrame / RDD и выполнить операции с результирующим DF / RDD.
changedDF = inputDF.repartition(500)
Вместо использования inputDF используйте changedDF
для выполненияОперации, вы должны получить 500 тактов.
При необходимости, в DataFrame Вы также можете упомянуть список столбцов для перераспределения changedDF = inputDF.repartition(inputDF.col1)