Как выполнить сравнение данных между 2 kafka topi c используя flink - PullRequest
0 голосов
/ 04 февраля 2020

Я застрял в сценарии, где мне нужно использовать поток данных из 2 или более тем кафки (после применения фильтра) и сравнить данные. Поскольку объем данных большой, пожалуйста, предложите лучшие доступные варианты. Возможно ли это с помощью flink?

Ответы [ 2 ]

0 голосов
/ 05 февраля 2020

Существует несколько различных способов, которыми можно было бы использовать этот подход для Flink. Более простыми вариантами, вероятно, являются либо

Использование Kafka с таблицей / SQL APi покрыто здесь .

0 голосов
/ 04 февраля 2020

почему бы не попробовать потоковое воспроизведение искры? В Spark есть коннекторы для чтения тем kafka и просмотра их в виде таблицы (иначе, датафрейм), и вы можете выполнять sql запросов поверх фрейма данных и сравнивать результаты

...