Question

Я застрял в сценарии, где мне нужно использовать поток данных из 2 или более тем кафки (после применения фильтра) и сравнить данные. Поскольку объем данных большой, пожалуйста, предложите лучшие доступные варианты. Возможно ли это с помощью flink?

David Anderson · Answer 1 · 05 февраля 2020

Существует несколько различных способов, которыми можно было бы использовать этот подход для Flink. Более простыми вариантами, вероятно, являются либо

интервальное объединение
или что-то вроде Table или SQL присоединение.

Использование Kafka с таблицей / SQL APi покрыто здесь .

ravi · Answer 2 · 04 февраля 2020

почему бы не попробовать потоковое воспроизведение искры? В Spark есть коннекторы для чтения тем kafka и просмотра их в виде таблицы (иначе, датафрейм), и вы можете выполнять sql запросов поверх фрейма данных и сравнивать результаты

Как выполнить сравнение данных между 2 kafka topi c используя flink

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как выполнить сравнение данных между 2 kafka topi c используя flink

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы