У меня SQL-запрос как таковой:
WITH cte AS
(
SELECT *,
ROW_NUMBER() OVER (PARTITION BY [date] ORDER BY TradedVolumSum DESC) AS rn
FROM tempTrades
)
SELECT *
FROM cte
WHERE rn = 1
и я хочу использовать его в spark sql для запроса моего фрейма данных.
мой фрейм данных выглядит так:
и я хочу иметь только максимум tradedVolumSum для каждого дня с описанием SecurityDescription. поэтому я хочу увидеть что-то вроде:
как бы я смоделировал такое же поведение в spark sql в python?
Спасибо!