Question

У нас недавно была проблема, когда некоторые из разделов Kafka были потеряны, и работа продолжалась без сбоев. Тем временем были добавлены новые разделы кафки. Похоже, что наша работа с потоковым воспроизведением не была перезапущена и она не получала никаких данных от новых разделов, пока мы не заметили расхождения в подсчетах. Мы возобновили работу, и все было хорошо. Итак, мой вопрос: потоковое API-интерфейс spark-kafka не проверяет время от времени добавление новых разделов? Есть ли какие-либо специальные настройки, чтобы включить это?

cricket_007 · Answer 1 · 30 октября 2018

AFAIK, Spark's Kafka Consumer не будет автоматически перебалансировать свою группу потребителей при добавлении новых тем / разделов.

Это одно из преимуществ, которые перечисляются при сравнении Spark Streaming с Kafka Streams, в том, что Kafka Streams восстановит баланс

знает ли spark о новых разделах, добавляемых в kafka?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

знает ли spark о новых разделах, добавляемых в kafka?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы