У меня есть много приложений по всему миру, которые отправляют данные на мой сервер.все данные производятся с использованием потока Kafka как авро в тему Kafka с 40 разделами. Я хотел бы предотвратить дублирование данных.в моем случае приложения могут отправлять одно и то же сообщение много раз (даже через несколько минут), и я хотел бы знать, может ли Кафка помочь мне предотвратить это.Есть ли какая-либо опция для «хеширования» сообщения и предотвращения его двойного производства для Kafka?
Я прочитал об этом ровно один раз и т. Д. Похоже, он поддерживает случай, когда производитель не смог произвести.
Мне бы хотелось, чтобы Кафка не допустил дублирования сообщений в течение ограниченного времени (скажем, 10 минут)