В Spark, пытающейся выполнить «частичную» оконную функцию.
Предоставление схемы eventId, impressionTime, кампании, дохода , я хотел бы знать для каждого вечера сумму дохода длякампания за последние 4 дня.
В конце я добавляю только последние 3 дня.Поэтому мне пришлось загрузить данные за 7 дней (поэтому у самого раннего события есть окно 4 дня), и проблема в том, что я буду рассчитывать также и события из моего окончательного диапазона.
Небольшой пример: у меня есть данныев течение 7 дней (день1, день2, день3, день4, день5, день6, день7 7 позже) и в выходных данных только дни: требуется 7,6,5.
Мне нужно окно для каждых 4дней.Поэтому я буду загружать все дни и делать для них оконную функцию.В конце я буду длиться всего 3 дня.
Конечно, это очень неэффективно, так как я рассчитываю окно также для дней 4,3 ...
Есть ли в любом случае функция окна для некоторых данных?
Спасибо