У меня есть код, который я пытаюсь оптимизировать, так как я хочу попробовать переписать SQL-код в чистый Spark, теперь у меня есть этот SQL-файл:
val df_result_week_agg = sparkSession.sqlContext.sql("SELECT group_id, client_id ,m_id ,min(date) stats_date ,sum(trans_cnt) trans_cnt,sum(revenue) revenue,count(DISTINCT id) cust_total, count(distinct returning_hash_id) loyal_cust_total ,'W' time_period FROM customers GROUP BY group_id, client_id , me_id, year(date),date_sub(to_date(date),date_format(to_date(date), 'u')-1)")
Есть ли какая-то статья или как это можнопомогите переписать это?Спасибо !