pyspark использует диапазон между функциями в spark sql - PullRequest
0 голосов
/ 11 июля 2019

когда я запускаю

spark.sql(''' 
        select client,avg(amount) over (partition by client
         order by my_timestamp
         range between interval 30 days preceding and current row) as moving_avg_amount
         from my_table''')

, это работает.

, но если я хочу исключить последние X дней - это не получается.

... range between interval 30 days preceding and 12 days preceding ..
   or :
 ... range between interval 30 days preceding and interval 12 days preceding .. 

что такоеправильный синтаксис для этого?

1 Ответ

1 голос
/ 11 июля 2019

В Spark SQL Window через интервал между двумя указанными временными границами - от 3 до 2 часов назад предполагается, что интервалы диапазона не работают должным образом в SparkSQL.

...