Ссылка на документы Scala для Spark и источник в документах (см. https://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.sql.DataFrameWriter),. Я заметил, что сигнатуры для функций sortBy и partitionBy очень похожи и, вероятно, должны быть одинаковыми, но я не могу понять, почемуsortBy разделил vararg на два аргумента.
В источнике Github говорится, что partitionBy был доступен с версии 1.4 Spark, а sortBy был представлен начиная с 2.0. Так что, возможно, два разных автора сделали это. Просто не знаю, почемубудет сделано один способ по сравнению с другим. Я где-то читал, что если у вас есть параметр varargs, вы можете полностью игнорировать его, передавая Nil - так что, возможно, тот, кто написал sortBy, хотел бы избежать этого, заставив хотя бы одно имя столбца бытьдоступны