знает ли spark о новых разделах, добавляемых в kafka? - PullRequest
0 голосов
/ 29 октября 2018

У нас недавно была проблема, когда некоторые из разделов Kafka были потеряны, и работа продолжалась без сбоев. Тем временем были добавлены новые разделы кафки. Похоже, что наша работа с потоковым воспроизведением не была перезапущена и она не получала никаких данных от новых разделов, пока мы не заметили расхождения в подсчетах. Мы возобновили работу, и все было хорошо. Итак, мой вопрос: потоковое API-интерфейс spark-kafka не проверяет время от времени добавление новых разделов? Есть ли какие-либо специальные настройки, чтобы включить это?

1 Ответ

0 голосов
/ 30 октября 2018

AFAIK, Spark's Kafka Consumer не будет автоматически перебалансировать свою группу потребителей при добавлении новых тем / разделов.

Это одно из преимуществ, которые перечисляются при сравнении Spark Streaming с Kafka Streams, в том, что Kafka Streams восстановит баланс

...