Быстрый вопрос, просто пытаясь понять, что именно означает spark.sql.shuffle.partitions
?Говорим ли мы о количестве секций, являющихся результатом широкого преобразования, или о том, что происходит в середине, как при некотором промежуточном разбиении перед результирующим разделением широкого преобразования?
Поскольку в моем понимании, согласно широкому преобразованию, мы имеем
Parents RDDs -> shuffle files -> Child RDDs
На что здесь ссылается параметр spark.sql.shuffle.partitions? перемешивает файлы или RDD для детей или что-то еще, что я проигнорировал?