Скажем, у меня есть некоторые потоковые данные схемы следующим образом:
uid: string
ts: timestamp
Теперь предположим, что данные были разделены на uid
(в каждом разделе данные минимальны, например, меньше 1row / sec).
Я хотел бы поместить данные (в каждом разделе) в окна на основе времени события ts
, а затем отсортировать все элементы в каждом окне (также на основе ts
), наконец, примените пользовательское преобразование для каждого элемента в окне в следующем порядке.
Q1: Есть ли способ получить агрегированный вид окна, но сохранить каждый элемент, например, материализовать все элементыв окне в список?
Q2: Если Q1 возможен, я хотел бы установить комбинацию водяного знака и триггера, которая срабатывает один раз в конце окна, затем либо периодически запускать, либо запускать каждый раз с опозданиемданные поступают.Возможно ли это?