мигать, когда использовать timewindowAll - PullRequest
0 голосов
/ 10 февраля 2020

У меня есть конвейер, который использует данные следующей формы: case class Foo(source: String, destination: String){def key=source+destination} Я хочу удалить все дубликаты source+destination, поступающие в один и тот же час, а затем я хочу подсчитать все вызовы, поступающие в пункт назначения в тот же час , Я создал конвейер с src ~> timewindow1(1 hour, keyBy:key) ~> timewindow2(1 hour, keyBy:destination) ~> ..., я должен использовать timewindowAll в timewindow2? enter image description here

1 Ответ

0 голосов
/ 10 февраля 2020

Вы должны использовать timeWindowAll только в тех случаях, когда вы не хотите иметь разделение на ключи. Поскольку вы набираете номер по назначению, вы должны использовать timeWindow, а не timeWindowAll.

...