Что может произойти, если Кафка потеряет синхронизацию разделов - PullRequest
0 голосов
/ 13 февраля 2019

У меня проблема с работой.У нас есть Кафка, которая работает на кластере HDP.Уже несколько дней Кафка теряет синхронизацию разделов, и я, кажется, теряю некоторые сообщения.Может ли кто-нибудь подтвердить мне, что если Кафка потеряет синхронизацию разделов, она может потерять сообщения?

1 Ответ

0 голосов
/ 17 февраля 2019

Все сообщения пишутся только в раздел лидера.Если у вас есть acks=1 в конфигурации производителя, то вам гарантировано, что сообщение было написано этому лидеру.

Если у вас также есть unclean.leader.election=false на каждом посреднике в кластере, то никакая несинхронизированная реплика не может быть выбрана лидером, поэтому не будет принимать записи и заставлять других подписчиков обрезать свои журналы до нечистоголидер.

Если ни одно из этих условий не выполняется, вы несете ответственность за пропущенные сообщения.


До недавних выпусков Kafka все еще были крайние случаи вокруг выборов лидера и усечения журнала, которые обсуждались на саммите Kafka 2018 - Укрепление репликации Kafka

Вы также можете проверить Cloudera FAQ, чтобы узнать, как настроить Kafka для надежного хранения данных

Но, хочу отметить, что выделите

Kafka не гарантирует , что потеря данных никогда не произойдет

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...