Apache Flink для ежедневного агрегированного отчета - PullRequest
0 голосов
/ 28 июня 2019

Флинк работает над кафкой для разных скоплений.Один из потоков, который мы анализируем, это order-audits (в основном каждое изменение состояния генерируется как событие).

Каждое событие-заказ выглядит примерно так:

{
  "id" : "ord-1",
  "merchant_id" : "merchant-a",
  "status" : "created",
  ...
  "updated_at" : 
  "event_time" : 
}

Я хочу запустить агрегат, который может агрегироваться на уровне продавца за определенный день.

Что-то вроде

{ 
   "merchant_id" : "merchant-a",
   "date" : "2019-07-01",
   "started" : 10,
   "completed" : 13,
   "cancelled" : 3
}

Подходит ли flink для такого типа агрегации?(Большинство примеров - прямое агрегирование)

Извините, если это повторяется / наивно.Спасибо!

1 Ответ

0 голосов
/ 28 июня 2019

Конечно, такой анализ легко выполнить с помощью Flink. Вероятно, вам будет проще всего это сделать с помощью API-интерфейса Flink SQL, поскольку кривая обучения здесь невелика - как только вы приступите к настройке, это будет очень просто, при условии, что вы знаете некоторый SQL.

Взгляните на https://github.com/ververica/sql-training/ для ознакомительного введения.

...