Существует DataFrame следующим образом:
import spark.implicits._
val df = List(
("id1","blue","1")
,("id2","red","2")
,("id3","red","3")
,("id4","blue","3")
,("id4","green","3")
).toDF("id", "color", "size")
+---+-----+----+
| id|color|size|
+---+-----+----+
|id1| blue| 1|
|id2| red| 2|
|id3| red| 3|
|id4| blue| 3|
|id4|green| 3|
+---+-----+----+
Существует Seq [org. apache .spark. sql .Column], и он может сортировать df
следующим образом:
import org.apache.spark.sql.Column
val col = Seq(new Column("size"), new Column("color"))
df.sort(col:_*).show
Но я хочу отсортировать по col
в порядке убывания.
import org.apache.spark.sql.functions.desc
df.sort(desc(col:_*))
не работает.
Тогда как отсортировать df
по col
в порядке убывания?