Azure Stream Analytics: несколько Windows JOIN генерируют слишком много строк - PullRequest
0 голосов
/ 19 мая 2018

Я делаю несколько расчетов на нескольких Windows.Каждое окно - это скачкообразное окно, которое выводит каждую секунду (с разной продолжительностью окна, конечно).

Тогда у меня есть только один выходной запрос, который объединяет мои 5 окон с DATEDIFF(second, a, b) BETWEEN 0 AND 1 для каждого присоединенного окна.

Проблема в том, что этот запрос генерирует намного больше строк, чем входных данных, но он должен генерировать такое же количество.(8 строк из ввода, 4002 строки из запроса)

Я не могу найти ничего в документе, который говорит об этом поведении.

ОБНОВЛЕНИЕ 1:

  • Я обнаружил, что при уменьшении диапазона JOIN DATEDIFF у меня меньше событий.

  • При использовании диапазона 0-50 мс во всех моих запросах у меня 17 событий, но при сравненииих 8 входных событий, они содержат дубликаты некоторых событий и не включают все события, поэтому данные не полны.

  • Мои шаги запроса выглядят так:

Window_N -> Stats_Window_N (SELECT FROM Window_N JOIN Window_N) -> All_Stats (SELECT FROM Window_N JOIN All Other Windows)

Все используют один и тот же диапазон DATEDIFF.

1 Ответ

0 голосов
/ 22 мая 2018

Что входит в критерии объединения?Напоминает мне декартово произведение, когда в соединении нет ожидаемого предложения ON.

Не могли бы вы дать немного буквального синтаксиса?Говорить об этом абстрактно может быть слишком сложно для понимания.

Спасибо, Джейсон

...