KSQL Event Merging - объединение событий из одного потока на основе метки времени - PullRequest
0 голосов
/ 04 марта 2019

Я пытаюсь объединить несколько событий из одного входного потока в одно выходное событие, сгруппированное по отметке времени с использованием ksql.Я также хотел бы, чтобы выходное событие содержало среднее значение входных событий, хотя это не совсем несоответствующее и более приятное описание.

Входной поток: температура

event1: {location: "hallway", value: 23, property_Id: "123", timestamp: "1551645625878"} 
event2: {location: "bedroom", value: 21, property_Id: "123", timestamp: "1551645625878"}
event3: {location: "kitchen", value: 20, property_Id: "123", timestamp: "1551645625878"}
event4: {location: "hallway", value: 19, property_Id: "123", timestamp: "9991645925878"} 
event5: {location: "bedroom", value: 18, property_Id: "123", timestamp: "9991645925878"}
event6: {location: "kitchen", value: 18, property_Id: "123", timestamp: "9991645925878"}

(желательно) Выходной поток:

event1:
{
    "property_id": "123",
    "timestamp": "1551645625878",
    "average_temperature": 21,   
    "temperature": [
        {
            "location": "hallway",
            "value": 23
        },
        {
            "location": "bedroom",
            "value": 21
        },
        {
            "location": "kitchen",
            "value": 20
        }
    ]
}

event2:
{
    "property_id": "123",
    "timestamp": "9991645925878",
    "average_temperature": 18,   
    "temperature": [
        {
            "location": "hallway",
            "value": 19
        },
        {
            "location": "bedroom",
            "value": 18
        },
        {
            "location": "kitchen",
            "value": 18
        }
    ]
}

Насколько я могу судить, это просто невозможно с помощью ksql, кто-нибудь может подтвердить?

1 Ответ

0 голосов
/ 04 марта 2019

Правильно, вы не можете сделать это в KSQL в настоящее время.Начиная с v5.1 / март 2019 года, KSQL может читать, но не строить вложенные объекты: https://github.com/confluentinc/ksql/issues/2147 (пожалуйста, добавьте комментарий или комментарий, если вам это нужно)

Вы можете вычислить среднее значение с помощью чего-либокак:

SELECT timestamp, SUM(value)/COUNT(*) AS avg_temp \
  FROM input_stream \
  GROUP BY timestamp;
...