Я понимаю, что rand()
создает столбец со случайными значениями, а orderBy
принимает столбец для сортировки по убыванию или по возрастанию.
Глядя на dataframe.orderBy(rand)
:
, я нахожу удивительным, что orderBy
может взять столбец и отсортировать, даже если он не был создан на dataframe
.
По сравнению с
dataframe.withColumn("X",rand).orderBy("X")
, где dataframe("X")
уже определено.
, что приводит меня к двум вопросам.
dataframe.orderBy(rand)
совпадает с dataframe.withColumn("X",rand).orderBy("X")
в контексте заказа?
Необходимо ли создавать дополнительные столбцы для заказа перед использованием .orderBy
?