Question

В spark я пытаюсь рассчитать три транзакции в одном окне.Поскольку у меня есть другой пример, использующий одни и те же окна много раз, это занимает слишком много времени.Я сократил мой пример, как показано ниже.Можно ли сделать это в одной оконной функции, как показано ниже.Выдает ошибку, как и ожидалось ...

val sonuc = data.withColumn("meanError",
  struct(mean($"errorGeneral"),min($"errorGeneral")).over(
  Window.partitionBy($"id").orderBy($"time".asc).rangeBetween(-240*3600,
  0)))

Спасибо.

Miguel A. Friginal · Answer 1 · 31 мая 2018

В этом нет ничего плохого:

val w = Window.partitionBy($"id").orderBy($"time".asc).rangeBetween(-240*3600, 0)

data.select($"*"
  mean($"errorGeneral").over(w),
  min($"errorGeneral").over(w)
)

Внутренне Spark придется перетасовать и заказывать только один раз.

Если это медленно, то это потому, что оконные функции находятся наверхусамые дорогие операции в Spark, особенно с такими широкими кадрами.

множественный расчет в оконной функции

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

множественный расчет в оконной функции

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов