Получите самую высокую цену с меньшим идентификатором, если два идентификатора имеют одинаковую самую высокую цену в Scala - PullRequest
0 голосов
/ 13 марта 2019

У меня есть вызов dataframe productPrice с идентификатором столбца и ценой. Я хочу получить идентификатор с наивысшей ценой, если два идентификатора имеют одинаковую наивысшую цену, я получу только тот, который имеет меньший номер идентификатора. Я использую

val highestprice = productPrice.orderBy(asc("ID")).orderBy(desc("price")).limit(1) Но результат, который я получил, - не тот, у которого меньший идентификатор, а тот, у которого есть больший идентификатор. Я не знаю, что не так с моей логикой, есть идеи?

Ответы [ 2 ]

3 голосов
/ 13 марта 2019

Попробуйте это.

scala> val df = Seq((4, 30),(2,50),(3,10),(5,30),(1,50),(6,25)).toDF("id","price")
df: org.apache.spark.sql.DataFrame = [id: int, price: int]

scala> df.show
+---+-----+
| id|price|
+---+-----+
|  4|   30|
|  2|   50|
|  3|   10|
|  5|   30|
|  1|   50|
|  6|   25|
+---+-----+


scala> df.sort(desc("price"), asc("id")).show
+---+-----+
| id|price|
+---+-----+
|  1|   50|
|  2|   50|
|  4|   30|
|  5|   30|
|  6|   25|
|  3|   10|
+---+-----+
0 голосов
/ 15 марта 2019

Подход к той же проблеме с использованием Spark SQL:

val df = Seq((4, 30),(2,50),(3,10),(5,30),(1,50),(6,25)).toDF("id","price")

df.createOrReplaceTempView("prices")

-

%sql
SELECT id, price
FROM prices
ORDER BY price DESC, id ASC
LIMIT(1)
...