Power M Query / Kusto бери первым из группы - PullRequest
0 голосов
/ 20 марта 2019

У меня есть таблица, которая выглядит следующим образом:

id  timestamp  value1  value2
 1  09:12:37     1       1
 1  09:12:42     1       2
 1  09:12:41     1       3
 1  10:52:16     2       4
 1  10:52:18     2       5
 2  09:33:12     3       1
 2  09:33:15     3       2
 2  09:33:13     3       3

Мне нужно сгруппировать по id и значению1.Для каждой группы я хочу иметь строку с самой высокой отметкой времени.

Результат для таблицы выше будет выглядеть следующим образом:

id  timestamp  value1  value2
 1  09:12:42     1       2
 2  09:33:15     3       2

Я знаю, что есть оператор суммирования, который дастмне это:

mytable
| project id, timestamp, value1, value2
| summarize max(timestamp) by id, value1

Result:
     id  timestamp  value1
      1  09:12:42     1
      2  09:33:15     3

Но я не смог получить значение2 для этих строк тоже.

Заранее спасибо

Ответы [ 2 ]

0 голосов
/ 20 марта 2019

Если я правильно понимаю ваш вопрос, вы сможете использовать summarize arg_max():

Документ: https://docs.microsoft.com/en-us/azure/kusto/query/arg-max-aggfunction

datatable(id:long, timestamp:datetime, value1:long, value2:long)
[
 1, datetime(2019-03-20 09:12:37), 1, 1,
 1, datetime(2019-03-20 09:12:42), 1, 2,
 1, datetime(2019-03-20 09:12:41), 1, 3,
 1, datetime(2019-03-20 10:52:16), 2, 4,
 1, datetime(2019-03-20 10:52:18), 2, 5, // this has the latest timestamp for id == 1
 2, datetime(2019-03-20 09:33:12), 3, 1,
 2, datetime(2019-03-20 09:33:15), 3, 2, // this has the latest timestamp for id == 2
 2, datetime(2019-03-20 09:33:13), 3, 3,
]
| summarize arg_max(timestamp, *) by id

Это приведет к:

| id | timestamp                   | value1 | value2 |
|----|-----------------------------|--------|--------|
| 2  | 2019-03-20 09:33:15.0000000 | 3      | 2      |
| 1  | 2019-03-20 10:52:18.0000000 | 2      | 5      |
0 голосов
/ 20 марта 2019

Я нашел решение своей проблемы, но, возможно, есть и лучшее.

mytable
| project id, timestamp, value1, value2
| order by timestamp desc
| summarize max(timestamp), makelist(value2) by id, value1

Результат:

 id  timestamp  value1  list_value2
  1  09:12:42     1     ["2", "3", "1"]
  2  09:33:15     3     ["2", "3", "1"]

Теперь вы можете расширить запрос, добавив

| project max_timestamp, id, value1, list_value2[0]

, чтобы получить первый элемент из этого списка.Замените '0' на любое число от 0 до длины (list_value2) -1, чтобы получить доступ к другим значениям.

Еще один совет: я использую метку времени, которая генерируется ApplicationInsights.В нашем коде мы вызываем TrackTrace для регистрации некоторых данных.Если вы упорядочите строки по этой отметке времени, результирующий список строк не гарантируется в том же порядке, в котором данные были получены в коде.

...