Хотя я очень предпочитаю использовать прямое SQL
вместо DSL
, есть случай, когда требуется последнее: когда мы хотим выполнить пользовательское агрегирование для строк группировки.
В чем я не уверен, так это как преобразовать это простое вычисление в DSL
:
100.0 * (count(*)-sum(dep_delayed))/count(*)
Что эквивалентно в DSL
? Необходимо ли создавать UDF
(/ AggUDF
), и если да, то как это будет сделано?